どうも、ひで(@hidetoshitwitt )です。
本記事で紹介する「iMyFone VoxBox」はプロ級の機能を備えながらも扱いやすさが魅力なAIテキスト読み上げソフト。
とは言え、今の時代、AI音声合成系のソフトは珍しいものでではありません。
では、このソフトを選ぶべき理由はなんなのか?

それはこのVoxBoxの圧倒的な多彩さにあります♪






なんと3500種類を超えるボイス(音声バリエーション)を誇る本製品。
さらに、音質強化やノイズ除去、音声変換など音声合成&テキスト読み上げだけにとどまらない多彩な機能。



これらを備えながらも、初心者さんでも扱いやすい簡単仕様♪
YouTubeでの広告収益など商用利用を検討中の方も要チェック。
本記事では「iMyFone VoxBox」の機能や特徴、メリット・デメリットなどをわかりやすくレビューします。
概要|多彩な声と機能で操るAIテキスト読み上げソフト
結論|iMyFone VoxBoxとは?
- これって何?:216種類以上の対応言語&3500個以上のボイスを駆使して表現力豊かなナレーションを生成する簡単&多機能はAIテキスト読み上げソフト
- 誰におすすめ?:多くの言語やボイスを使い込みたい方。商用利用を検討してる方。読み上げソフトに不慣れな方も。
- 製品の良いところ:多言語、多ボイス、多機能。扱いやすいUI。画像やPDFからも音声生成。
- 製品の注意点:Mac版の機能は限定的? 豊富すぎるライセンスのラインナップ。音声クローンはSVIPのみ。
- どこで買える?:公式HP
iMyFone VoxBoxの主な機能
















- テキスト読み上げ
- 文書・画像読み上げ
- 音声クローン
- 音質強化
- 文字起こし
- 音声変換
- AIラップ生成
- 録音
- 音声形式変換
- 音声編集 など
必要動作環境
対応OS | Windows 7/8.1/10/11 macOS 10.10-13 iOS 13-16 Android 7-13 |
プロセッサ(CPU) | Intel i3またはそれ以上のマルチコアプロセッサ、2GHzまたはそれ以上。(HDにはIntel第6世代またはそれ以降のCPUを推奨) |
RAM | 4 GB RAM |
グラフィックス | Intel HDグラフィックス5000またはそれ以降、NVIDIA GeForce GTX 700またはそれ以降。 AMD Radeon R5またはそれ以降。2GB vRAM(HDには4GBが必要)。 |
ディスク | インストールするには最低10GBのHDD空き容量が必要 (HDを編集する場合、SSD-ソリッド・ステート・ディスクを推奨) |
備考 | ソフトウェアの登録やオンラインサービスへのアクセスには、インターネット接続が必要 |
対応ファイル形式
入力形式
音声 | .mp3/.wav/.m4a/.aac/.flac/.ogv/.mov/.mp4/ .m4v/.avi/.opus/.webm/.weba/.ogg/.oga/.mid/ .amr/.aiff/.wma/.au/.ogm/.wmv/.mpg/.asx/.mpeg |
画像 | .png/.jpg/.jpeg/.bmp/.tiff |
文書 | .pdf/.doc/.docx |
出力形式
文字起こし | .txt |
音声出力など | .mp3/.wav/.aac |
レビュー|iMyFone VoxBoxはここに注目
「iMyFone VoxBox」の特徴や機能など注目しておくべきポイントを紹介します。
- 画像やPDFも!多様な読み上げ方法
- 200以上の言語と3500種以上のボイスに対応
- VoxBoxの商用利用について
- 読み上げ以外の多様な機能
└ 音声クローン、音質強化、AIラップ生成など
画像やPDFも!多様な読み上げ方法


「iMyFone VoxBox」は一般的なテキスト入力以外にも複数の方法でテキスト読み上げが可能です。


- テキスト入力
- Word文書、PDFからテキストを抽出
- JPG、PNGなどの画像ファイルからテキストを抽出



画像ファイルからも読み上げできるんだ!
試しに作成した以下のJPGファイルからテキストを抽出します。


上記ファイルを「VoxBox」にアップロード。


これくらいのボリュームなら即座にテキストの書き出しは完了します。
同様に長文のPDFファイルやWord文書からも問題なくテキストを抽出できました。





あとは「▶生成」ボタンを押せば音声ファイルが生成♪
以下、ボイス「マサルさん」に読み上げてもらったテキスト。未調整の素の音声です。
200以上の言語と3500種以上のボイスに対応
入力したテキストの読み上げは日本語、英語など200を超える言語と3500を超える個性豊かなボイスから選択。
大量のボイスもキーワードや各種ソート項目などでスムーズに絞り込み可能。


ほとんどのボイスには複数のサンプルボイスが用意。その場で各キャラクターの特徴や感情表現などをチェックできます。
読み上げの際には、ボイスごとにスピード、ピッチなど各種パラメーターの調整も行えます。


行を追加することで、複数のボイスを会話形式でリスト。


VoxBoxの商用利用について
「iMyFone VoxBox」の一部のボイスを用いて生成した音声ファイルは商用利用も可能です。





「人間」カテゴリのボイスは商用利用オッケー♪
それ以外のボイスで生成した音声の使用は個人利用に限定されるとのこと。
商用利用可能なボイスは「商用利用可能マーク」でも確認できます。





記事執筆時点では186種のボイスが商用利用可能だね!
選択肢としては充分でしょう。
読み上げ以外にも多様な機能
「iMyFone VoxBox」はテキスト読み上げ以外にも数多くの便利機能を備えます。
- 音声クローン
- 音質強化
- 文字起こし
- 音声変換
- AIラップ生成
- 録音
- 音声形式変換
- 音声編集 など
音声クローン
「音声クローン」は合成した自分の声でテキストを読み上げる機能。VoxBoxの完全版にあたる「SVIPプラン」ライセンスの購で使用できます。





完全版ユーザーの重要機能になりそうだね!
音声クローンは、自身の音が収録された動画&音声ファイルのアップロード、もしくはソフトで録音した音声から作成可能。


今回は「録音を」を試します。




僕のライセンスは「SVIP」ではなく1つ下の「VIPプラン」。なので、音声クローンの使用はできません。ですが、「無料プラン」と同様にクローンのサンプル作成と視聴は可能。





少しだけイケメンな自分の声が聞けました♪
音質強化
「iMyFone VoxBox」を使い、ノイズ除去や発声の修正など手元の音声ファイルの音質を改善も。


- 背景ノイズ軽減
└ 背景ノイズやBGMを削除し、ボーカルを強調 - 音質向上
└ 音声ファイルの明瞭さやバランスを調整し音質を改善 - 発音改善
└ 音声のクリック音、S音、P音を除去 - 音質修正
└ 音量が小さくなっている部分を他所の音量に合わせる
文字起こし
mp3やwavなどの動画や音声ファイルからテキストを抽出する機能。





YouTubeのテロップ作成などで活躍しそうですね♪
音声変換
AIを用いてmp3やwavなどの音声を、別のボイス(キャラクター)に変換する機能。





自分の声が他のキャラクターや性別に♪
AIラップ生成
「iMyFone VoxBox」には、AIを用いて自動でラップを作成してくれるユニークな機能も搭載されています。


入力した歌詞を、選択したラッパーがリズムカルに歌ってくれます。
生成されたラップがこちら。



歌詞はAIでの自動生成もオッケー!
録音
VoxBoxで音声を録音し、MP3/AAc/WAVファイル形式で保存することも。





オンライン会議やスピーチ、講義などの記録におすすめ♪
音声形式変換
「音声形式変換」は手持ちの音声や動画フィアルを他の形式に変換する機能です。
音声編集
トリミングなど簡単ではありますが、音声ファイルの編集も。


感想|iMyFone VoxBoxのメリット&デメリット


「iMyFone VoxBox」を使って感じた良い点や気になる点をまとめます。



わかりやすさと多彩なボイスは扱いやすい♪
商用利用可能なボイスの種類が多いのも嬉しいですね。
メリット
特に気に入ってるのがこちらのメリット。
- 直感的でわかりやすい操作方法
- テキスト、画像、PDFを音声に変換
- 216以上の言語&3500以上のボイス
- 読み上げ以外にも多様な機能
- 自分の声の合成も(音声クローン)
- 商用利用も可能(一部のボイス限定)
やはり簡単操作で扱える3500ものボイスバリエーションや多彩な機能は圧巻です。








デメリット
一方、以下は少し残念ポイにと。
- 音声クローンは「SVIP」のみ
- Mac版の機能は限定的?
- ライセンスの内容が少し複雑



1つだけで良いのでVIPプランでも音声クローンが作れるたら・・
また、こちらはiMyFone様に問い合わせ中なのですが、Mac版はWindows版と比べて使える機能が少ない様です。


VoxBoxは1ライセンスで複数のPCで使用可能。(同時使用&ログインは不可)
WindowsでもMacでも使うという方なら問題ありません。ですが、Macのみの方はあらかじめ使用できる機能を無料版で確認しておきましょう。
また、バリエーションに飛んだ多彩な有料ライセンスも、敢えて言うならわかりにくいとも感じます。





多彩なユーザーさんの用途や環境に細かく対応できる充実のラインナップとも言えますが・・
ただ、機能が豊富なソフトだけあって、どのコースが自身に最適なのか? 少し判断しづらいかもしれません。
こちらも最初は「無料版」から。以降は随時、短いスパンのライセンスから試してみるのも良いのかもしれません。
まとめ|多彩な機能やボイスが活きるAIテキスト読み上げソフト


本記事でレビューした「iMyFone VoxBox」は多彩なボイスや多様な機能を簡単に扱えるAIテキスト読み上げソフトな。



より多くのボイスを扱いたいなら特におすすめのソフトです♪
使い方も簡単。初心者さんでも気軽に使えるのも良いですね。


- 直感的でわかりやすい操作方法
- テキスト、画像、PDFを音声に変換
- 216以上の言語&3500以上のボイス
- 読み上げ以外にも多様な機能
- 自分の声の合成も(音声クローン)
- 商用利用も可能(一部のボイス限定)
- 音声クローンは「SVIP」のみ
- Mac版の機能は限定的?
- ライセンスの内容が少し複雑
ボイスや対応言語の豊富さや扱いやすい操作性、多彩な機能などかなりコスパに優れたテキスト読み上げソフト。



商用利用可能なボイスの豊富さも嬉しいです♪
ただ、必要ライセンスの見極めはちょっと難しいかも。まずは無料版から試してみるのも良いのでは?

