ホール*オブ*アス

断続 断裂

新しい動画文字起こしサービス(またはライブラリ)を作りたかった

「いや、まだチャンスはある!」

「いいえ、それは現実逃避です。」

クオリティの低い小芝居を文章で見せられても困るでしょうから深みにハマる前に本題に入ります。
要するに動画を文字起こしするライブラリを作りたかったという話です。タイトルで言ってますけど。

ただ動画の音声を文字起こしするだけのものならそのへんに転がってるものをググってコピってベタッとやって動かせばいいだけなんですが、私の想定していたものは、そういうのとは違います。

どういうものか。

動画からの文字起こし手順

・動画を再生しながら、文字起こしを自動的に行います。 Google Cloud Speech APIとかを使って。
・文字起こしされた文章は、ある程度の文字数でまとめて、動画の下に生成されていくテキストエリアにぶち込み、編集できるようにします。動画は再生したままです。
・このテキストエリアの横あたりには動画のシーケンス位置(時間)とのリンクが自動的に貼られ、すぐに動画の任意の位置に飛べるようになっています。デフォルトはそのテキストエリアに表示されている最初の文字が検知された位置です。
・テキストエリア内の文章はMarkdownで編集が可能で、プレビューが横(あるいは下)に表示されます。
・これには編集ボタンも付与されており、秒数を変更することも可能です。実際の動画と文字起こしされたシーケンス位置にズレが生じる場合は修正できます。
・このテキストエリアは文字のまとまりごとに生成されていきます。
・動画はショートカットキーで早送り巻き戻しを簡便にできます。音量の調節や、テキストエリア間の移動といった動きにも対応します。
・こうして動画の文字起こしが簡単に、素早くできるようになります。

この動画文字起こしサービスで何がしたかったか。

・作りたかったのは、ドットインストールでみるような、あの動画の下にある文字表示&動画シーケンスへのリンク。
・あれをもう少し拡張して、動画から文字起こしをするのを手軽にできるようにし、「動画を録画しながらブログを書く」ような形でアウトプットを作成する手法を新しく作りたかった。
・もう少し文字を装飾できるようにして、構造的な文章とリンクする動画、動画とリンクして文章でも楽しめるような仕組みを作りたかった。

メリット

・動画より文章のほうがSEO的に有利なはず。(Googleさんはそこをすでに飛び越えてるかもしれないけど)
・検索性がよくなる。ページ内でも、おそらくはサーチエンジンからも。
・動画をみるのがダルいときも時間がないときもある。動画より文章のほうに親しんでいる人もたくさんいる。
・なにより、動画の無駄な部分を見る時間を節約できる。サクッと文章を斜め読みして、見たいところだけ動画で見るということができる。
・YoutuberやVtuber、ニコ生主が手軽にブロガーを兼ねることができる。露出場所が増えるということは、多くの顧客にアプローチできるということ。
・こうした理由で動画の内容を把握しやすくなることにより、動画という見るのに時間のかかる媒体をより短時間で閲覧することが可能になり、ユーザーはより面白い情報、自分が求めている情報にリーチできるようになる。

作るのをやめた理由

・仕事が忙しいので。

作りたかったなー。

もちろん、ここに書いたということは誰か別の人が作っても文句はいいませんということです。
もし、ちょっと良いかもとか思ってこういうのを作ってくれた人がいたとしたら、教えてくれると嬉しい。