Topへ
検索へ
04 May 19:30
whisper.cppのCoreML版のlargeモデル、一回目は初回起動時の処理が色々走るから遅いみたいだったけど同じファイルで二回目実行したら20分で処理できる感じ。ストリーム処理も使える。largeモデルだとCoreML無しだとほぼ使い物にならなかったけどこれだとまあまあ使える 問題はアプリがC++ベースなので他との連動がめんどいというところですな。。pythonバインディングも出てたけどこの最新版とサクッとつながるのかどうか。。
というのを読み上げてみて認識させてみたのがこれ
↓
それでは読み上げていきます。
(一方で)CPPのCore ML版のラージモデル。1回目は初回起動時の処理が…。
同じファイルで2回目実行したら、20分で処理できる。
ストリーム処理も使える。LargeモデルだとCore ML無しだと
お使い物にならなかったけどこれだとまあまあ使える問題はアプリが c +
プラスプラスベースなので他との連動が面倒いなというところですが
Python Bindingも出てたけど、この最新版とサクッと繋がるのかどうか。
次回は、このような映像を作ります。それでは、また!
Original Link
04 May 17:47
寝落ちしながら一応最後まで観た 英語x数学でかなりの難易度だ。。nanoGPT、いじるにはなかなかおもしろい題材だと思うけど日本語圏での知名度は全然高くない感じ
Let's build GPT: from scratch, in code, spelled out. - YouTube
https://www.youtube.com/watch?v=kCc8FmEb1nY&t=6s
Original Link
04 May 14:31
Coleman Researchから25分で80ドルのサーベイ依頼が来た
Original Link
04 May 13:16
CoreMLでwhispe.cpp動いた。Eコア使い切ってる 初回起動時のなにかのコンパイルが1hくらいかかった 実際の処理はそんなに高速なようには見えないが。。。 https://kamiyacho.net/media/L4rGm_Em6p354Fg9p-E
Original Link
04 May 07:52
秋葉原MOGRAでアニメ地獄ってイベントがあったらしい あるDJのセットリスト見るとわかってる感が半端ない
https://twitter.com/DJYurufuwa/status/1653878757541957634?s=20
動画配信は有償Twitchでありそう
MOGRAさんのビデオ - Twitch
https://www.twitch.tv/mogra/videos?filter=archives&sort=time
Original Link
04 May 06:39
アップル公式のトランスフォーマー実装
GitHub - apple/ml-ane-transformers: Reference implementation of the Transformer architecture optimized for Apple Neural Engine (ANE) https://github.com/apple/ml-ane-transformers
Original Link
04 May 06:38
@masaka とか言ってたらcoreml対応してるらしい 昨日自分もこのオプション気付いて少し試したけどダメだったが、手順を踏めば動くようだ 70倍速いんだとか
Original Link
04 May 06:11
元祖分スプレッドシート作ったダンブルックリンがやってるossらしい。知らなかった
Software Garden Products: wikiCalc Program http://www.softwaregarden.com/products/wikicalc/
Original Link
03 May 23:42
Colabのインスタンス再起動したら、WhiperのLargeモデルでもメモリ足りた。あと一回のバッチジョブの時間(30分なのかな?)の範囲で1時間の通録(を話者分離して細切れにしたものを個別にwhisperにかける)というのはできた。
まあもうちょっとちゃんとやるにはColabProを契約するんだろうな
あと音声認識結果をそのままGPT-4に要約してもらうところまで自動化できたら良さそう。Web版ChatGPTにコピペしてやろうとしたら以外と一回の文字数制限が低くて厳しかった タイムスタンプとかで文字数使っちゃってるからかも。
Original Link
03 May 22:42
話者分離&音声認識、whisperのmediumモデルなら無料colabで動作できた。超簡単。でもこれプロダクションでちゃんと動く環境作って運用するの結構めんどそう。。
whisperのlargeモデルだとColab Proじゃないとメモリたり無さそう。(メモリ不足でクラッシュしちゃった
pyannote.audioで簡単話者分離〜whisperを添えて〜 - Qiita
https://qiita.com/sayo0127/items/e22fdc229d2dfd879f75
Original Link
03 May 18:38
ミスリーディングチャットでもトランスフォーマー話 なんとなくわかった気になる
#111: Formal Algorithms for Transformers – Misreading Chat https://misreading.chat/2023/04/04/111-formal-algorithms-for-transformers/
Original Link
03 May 05:14
バイデン政権が脱C/C++政策とか 行き先はGo/Rust Javaじゃないのね
Original Link
02 May 21:44
Original Link
02 May 21:15
お疲れ様でした!あざます!
Original Link
02 May 20:49
https://us05web.zoom.us/j/86382143841?pwd=eUwvcS8wWW1ta2JKemhML3NzSzZCUT09
Original Link
02 May 20:49
突然終了w
Original Link
02 May 19:58
@masaka
https://us05web.zoom.us/j/84482125238?pwd=SGkxa2NWQmhqZjhVeXR2TEdxTXdKQT09
Original Link
02 May 19:41
ぜんぜんだいじょうぶす
Original Link
02 May 19:40
@masaka @sakurai
Original Link
02 May 19:40
ちょっと20:00過ぎるかもです
Original Link
02 May 18:47
ダラダラ眺めるのに良さそう
イラストで学ぶ 世界を変えたコンピュータの歴史 : レイチェル・イグノトフスキー, 杉本 舞: 本 https://www.amazon.co.jp/%E3%82%A4%E3%83%A9%E3%82%B9%E3%83%88%E3%81%A7%E5%AD%A6%E3%81%B6-%E4%B8%96%E7%95%8C%E3%82%92%E5%A4%89%E3%81%88%E3%81%9F%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E3%81%AE%E6%AD%B4%E5%8F%B2-%E3%83%AC%E3%82%A4%E3%83%81%E3%82%A7%E3%83%AB%E3%83%BB%E3%82%A4%E3%82%B0%E3%83%8E%E3%83%88%E3%83%95%E3%82%B9%E3%82%AD%E3%83%BC/dp/4422414496
Original Link
02 May 18:44
インクリメントピーひどいな
トラップストリート - Wikipedia https://ja.wikipedia.org/wiki/%E3%83%88%E3%83%A9%E3%83%83%E3%83%97%E3%82%B9%E3%83%88%E3%83%AA%E3%83%BC%E3%83%88
Original Link
02 May 18:42
会社で買っとくか
AI白書 2023 | AI白書編集委員会 |本 | 通販 | Amazon https://www.amazon.co.jp/dp/404911142X/
Original Link
02 May 12:35
鳥識別アプリ
Merlin Bird ID – Free, instant bird identification help and guide for thousands of birds – Identify the birds you see https://merlin.allaboutbirds.org/
Original Link
02 May 09:40
プレインパッド社の卒業公演(退職理由発表会的なもの)制度面白いな
一方で非卒業公演というのをやったらしい(辞めない理由を述べるというもの
Original Link
02 May 04:53
リア周りがめちゃかっこいい 全高1550にしてくれたらもうこれでいいです
【試乗インプレ】トヨタ、新型「クラウンスポーツ PHEV/HEV プロトタイプ」 ショートホイールベースの異次元コーナリング / - Car Watch https://car.watch.impress.co.jp/docs/news/impression/1497709.html
Original Link
02 May 04:48
ガンマとかイプシロンとか聞いても陰の実力者になりたくて!しか連想できなくなってしまった
【ニュース】あのランチアがいよいよ復活 - webCG https://www.webcg.net/articles/-/48200
Original Link
01 May 23:14
transformersについていろいろgpt-4に聞いてた かなり複雑だが勉強としては非常によい体験 あほみたいな質問をしつこくいつまでも訊ける
ただし数学的には全然わかってない
Original Link
01 May 22:16
私は明後日から
Original Link
01 May 21:39
ちなみにまだワタクシのGWは始まっておらず。。家の人に至ってはシステム更改でほぼずっと仕事
Original Link
01 May 21:37
@sakurai とりあえず明日2000やりますかー
Original Link
01 May 21:11
@masaka すません明日20:00くらいにzoomれます。明日以降でもzoomれます
Original Link
01 May 20:18
WEB+DB PRESS休刊か
Original Link
01 May 19:54
主要きゃりあとの連携も強化されるとかなんとか
Original Link
01 May 19:53
そうそう
Original Link
01 May 18:04
ほんまや
Original Link
01 May 17:55
@h_horinouchi まじかよ日本も?
Original Link
01 May 16:11
0120料金46%安くなったらしい
https://aws.amazon.com/jp/about-aws/whats-new/2023/04/amazon-connect-reduces-japan-toll-free-inbound-minute-rate/
Original Link
01 May 15:33
ホリミヤOVA版(オリジナルビデオアニメ)っていうのがあるようだ 植田佳奈が出てるというからメインヒロインかと思ったがそうではないらしい ツンデレといえばこの人という印象なのだが違った
Original Link
01 May 12:24
複数のExcelファイル同士がデッドロックみたいな状態になるの何とかならんのか
Original Link
01 May 12:23
自分はWeb4コマの原作厨です>ホリミヤ
http://dka-hero.me/top.html
Original Link
01 May 12:21
EMOTET
Original Link
30 Apr 23:35
@masaka アニメ版ホリミヤ、7月に2期やるんですね だから再放送してるのか
Original Link
30 Apr 23:04
アニメ版ホリミヤやっぱ名作だなー ED映像もすごい
Original Link
30 Apr 22:54
proのM1が欲しいけど17万は流石にですね。。下取り高いからいいんだろうけど
Original Link
30 Apr 22:52
かっちゃおうぜ
Original Link
30 Apr 22:39
定期的にデカいiPad欲しくなる病気が発症
Original Link
30 Apr 21:24
日立物流、外資ファンドにtobされたのか
Original Link
30 Apr 19:19
推敲ツールっていう発想はいいね
文賢(ブンケン)~文章をより良くするための推敲・校閲・校正支援ツール https://rider-store.jp/bun-ken/
Original Link
30 Apr 17:56
RTX-3090 24Gが14万円とな
Original Link
30 Apr 17:28
世間的には今日はGW二日目ってことになってるの?
Original Link
30 Apr 16:54
この一番下の
pip install -qq https://github.com/pyannote/pyannote-audio/archive/refs/heads/develop.zip
をやるととりあえずM1Macローカルでもpyannoteインストールできそうだ、、そして動かしてみたら見たこと無いレベルでCPU使っとる がこの状態でも普通にうごくのがM1Macのすごいところ
Why can't I install Pyannote for Python? - Stack Overflow
https://stackoverflow.com/questions/76095990/why-cant-i-install-pyannote-for-python https://kamiyacho.net/media/M4gzlZAo7eV7IQpHAuc
Original Link
30 Apr 16:39
ちなみにこのモジュール使えば再生音をPython アプリで拾えるようになる(まあPythonに限らず世の中的にはいろいろあるとは思うけど) これつかってZoomとかGoogleMeetとかの出力音声を拾ってその場で話者分離と音声認識ができればよいのだがまあ先は遠い ZoomAPIで通録からやるなら割とすぐできそう。面倒そうだけど
SoundCard · PyPI
https://pypi.org/project/SoundCard/
Original Link
30 Apr 16:34
npaka先生がまとめられていた
関連リンクも参考になる
Google Colab で はじめる OpenAI Whisper|npaka|note
https://note.com/npaka/n/neb755633eb43
Original Link
30 Apr 16:27
話者単位に一旦WAVを分割してから音声認識させて最後に統合するみたいな処理が必要ぽい。まあこのへんは自分ではやらなくていいかな colabだと普通にできるようだ(M1Macで軽く試したけどpython系のインストールでいろいろハマりそうだった)
WhisperとPyannoteを用いた話者分離と音声認識 | Hakky Handbook
https://book.st-hakky.com/docs/whisper-pyannote-diarization/
Original Link
30 Apr 15:54
whisper.cppのapple silicon版でlargeモデルのファイルからの認識ならかなり高精度。リアルタイムはm1MacBookAirだとしんどいですね。モデルを小さくすればできそうだけど精度が下がる
あと話者特定はこんなのを使うらしいです。これもGPU前提なので、やっぱこのへんの処理はColabでやるのが本筋でしょうね。。
音声認識Whisperと話者識別Pyannote.audioで議事録自動作成 | 鷹の目週末プログラマー
https://happy-shibusawake.com/whisper-pyannote-audio/1204/
Original Link
30 Apr 13:34
なんか出た
ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside
https://inside.pixiv.blog/2023/04/28/160000
Original Link
30 Apr 11:28
今期アニメ ベストOPはスキップとローファーですね
Original Link
30 Apr 10:37
huggingface transformers大体理解した
npakaさんのブログも良いが、結局はchatgptに色々質問するのが一番理解が早い
Original Link
30 Apr 07:51
32k tokens、apiからは使えないという話も聞いたが使えるようだ。。一回300円くらいかかるみたいだけど
会社でみんながこれやったらえらいことになりそう
What is the difference between the GPT-4 models? | OpenAI Help Center https://help.openai.com/en/articles/7127966-what-is-the-difference-between-the-gpt-4-models
Original Link
30 Apr 07:22
bmwの営業さんがコムデギャルソン川久保怜が客として来たとか言ってました ミニの店舗が六本木ヒルズにまだあった頃の話 昔の観音開きのクラブマンを買ったそうです
Original Link
29 Apr 23:39
Original Link
29 Apr 23:32
ギャルソン
Original Link
29 Apr 19:59
これがいいらしい
GistPad - Visual Studio Marketplace https://marketplace.visualstudio.com/items?itemName=vsls-contrib.gistfs
Original Link
29 Apr 19:56
初の水風呂全身没入成功
Original Link