ちなみにこのモジュール使えば再生音をPython アプリで拾えるようになる(まあPythonに限らず世の中的にはいろいろあるとは思うけど) これつかってZoomとかGoogleMeetとかの出力音声を拾ってその場で話者分離と音声認識ができればよいのだがまあ先は遠い ZoomAPIで通録からやるなら割とすぐできそう。面倒そうだけど
SoundCard · PyPI
https://pypi.org/project/SoundCard/
Original Link
話者単位に一旦WAVを分割してから音声認識させて最後に統合するみたいな処理が必要ぽい。まあこのへんは自分ではやらなくていいかな colabだと普通にできるようだ(M1Macで軽く試したけどpython系のインストールでいろいろハマりそうだった)
WhisperとPyannoteを用いた話者分離と音声認識 | Hakky Handbook
https://book.st-hakky.com/docs/whisper-pyannote-diarization/
Original Link
whisper.cppのapple silicon版でlargeモデルのファイルからの認識ならかなり高精度。リアルタイムはm1MacBookAirだとしんどいですね。モデルを小さくすればできそうだけど精度が下がる
あと話者特定はこんなのを使うらしいです。これもGPU前提なので、やっぱこのへんの処理はColabでやるのが本筋でしょうね。。
音声認識Whisperと話者識別Pyannote.audioで議事録自動作成 | 鷹の目週末プログラマー
https://happy-shibusawake.com/whisper-pyannote-audio/1204/
Original Link
32k tokens、apiからは使えないという話も聞いたが使えるようだ。。一回300円くらいかかるみたいだけど
会社でみんながこれやったらえらいことになりそう
What is the difference between the GPT-4 models? | OpenAI Help Center https://help.openai.com/en/articles/7127966-what-is-the-difference-between-the-gpt-4-models
Original Link
もともとMLやってた側の人たちがLLMについて語る、というなかなか面白い内容 あと社内タスクフォースの事例話とかもあり、参考になりそう
68. まだまだ続くよ白金鉱業FM!ChatGPTをはじめとした「基盤モデル・大規模言語モデル 社内タスクフォース」の話! | 白金鉱業.FM https://shirokane-kougyou.github.io/episode/68
Original Link
BeeX社のインフラ担当がec2操作ミスが多いとか家の人がぼやいていたので(GWのシステム移行中)それは多分関連会社の新卒2年目にSAAだけ取らせて現場に投入されてる外注さんだよという話をした
あと顧客サポート用に自社開発のチャットアプリみたいなのを提供してるようだがかなりショボい
Original Link
どういうことかわからん
Amazon Connect Customer Profiles がエージェントワークスペースにおけるケース情報の表示に対応 https://aws.amazon.com/jp/about-aws/whats-new/2023/04/amazon-connect-customer-profiles-cases-information-agent-workspace/
Original Link
ng先生によるプロンプトエンジニアリング講座
ChatGPT Prompt Engineering for Developers - DeepLearning.AI https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/
Original Link
PC-100は本当に憧れでした。。
MacやWindowsには“元ネタ”があった 「パロアルト研」が残した「Alto」を振り返る(ITmedia NEWS) - Yahoo!ニュース https://news.yahoo.co.jp/articles/e661e7718101c5b915b778aef1d13eb6e15a3774?page=4
Original Link
なんか色々
Goodbye ChatGPT: Here Are (New) AI Tools That Will Blow Your Mind | by Nitin Sharma | The Startup | Apr, 2023 | Medium https://medium.com/swlh/goodbye-chatgpt-here-are-new-ai-tools-that-will-blow-your-mind-f244ed1288ca
Original Link
副業バイトの件、若干放置してましたが改めて今日またii★okaさんとのMTG議題に載せまして、作業ボリュームと期間みたいなところを具体化せよみたいな話になってます。内容としては一旦アプリの動作キャッチアップしたあとでcypress使ったe2eテストのコード作成みたいな感じです。react自体の開発というところからは若干離れちゃうんですけどそんな感じでも一旦やってみます?というのをGW中でもいいのでどこかで軽くまたZoomでもやりませう @sakurai
Original Link
便利そうだけど、切り取って炎上とかもしやすくなるんじゃと
炎上しにくいのがポッドキャストのいいところだと思ってたけど
はてな創業者の近藤さんがはじめた「LISTEN」が、ポッドキャストをブログ化してくれそうで楽しみです。|徳力基彦(tokuriki)|note https://note.com/tokuriki/n/n9609e5a10afd
Original Link
南は薬院までか 大橋にも結構スタートアップあるんだけどな
福岡市スタートアップ地図2023公開~スタートアップ都市ふくおか宣言から10年、スタートアップエコシステムの動向と今後への更なる期待~|TORYUMON Journal|note
https://note.com/fvmedia/n/n1431ca407172
Original Link