「できるかな」の続編=「できそうバイ」➡「できそうパイソン」(のりすぎ)
「できるかな」 https://kenu2015.hatenablog.com/entry/2025/06/09/071328
で音声(ファイル)をテキストファイルに無料でへんかんし、それがGoogleドキュメント音声入力以上という難題に挑戦するために、python(プログラム言語のひとつ)を使ってやってみようと決心したことを書いた。
pythonは初心者、しかも2年の中断あり一からやり直し。
ところが、調べていくと面白いことがわかってきた。
(1)ここ数年「 AI 」の進歩がさらに加速している。
安易に生徒たちが生成AIを使い宿題・リポートを書くなどが教育現場で心配されていた。そこで、ChatGPT に頼りすぎて自分で考えるたり調べたりすることをしなくなるのではないか、思考力が低下するのではないか、などの心配が起こる。そしてある人たちは、私のその典型的例だが、自らを守るため、「使わない・学ばない・関心を示さない」道を進む。「そんなの使わなくとも俺はできる」とうそぶきながら。
今回、この課題(=pythonを使って、音声ーテキスト変換を行う)を解決するための方法を模索するうちに、(今からAIを使う前から)AIの力を思い知らされている。
Open AI(法人の名前)からリリースされているWhisperは自動音声認識を行う。それには無償オープンソース版があり、誰でも使える。有償版もある。無償版と有償版の違いは、やはり音声認識するファイルの大きさ、つまり時間か?そうなると最初の困難にうちあたるが・・・・・(https://kenu2015.hatenablog.com/entry/2025/06/09/071328 の6行~8行)実はそこもpythonプログラムで解決できそうだ。長いファイルを短時間ごとに切り刻み次々と変換させるのだ。こんな単純作業の繰り返しは、コンピュータの最も得意とすることの一つだ。
(2)pythonにはライブラリが豊富
Pythonには、様々な用途のパッケージ(ライブラリーやツール)がたくさんある。これを利用して「人のふんどしで相撲を取る」ことができる。しかもそれは何の罪でもない。プログラミング環境のカスタマイズはそれ自体がプログラム開発なのだ。
(3)短時間でYoutubeで学べる
競争の激しいVチューバ界、わかりやすく・短時間で説明する動画がたくさん出ている。みるとHow toモノも多く、過ぎに役に立つ。いくつかの動画を見ると方法に違いなど学べるし、実に面白い。パソコンを2台準備し学びながら作業する。
(続く)