尼子ねからLexからTranscribeして結果をGPTに渡せば、普通にそこそこ動くボイスボットで自動注文受け付け作れるな。。。Transcribeでいけてないところをほぼほぼカバーできる。。
あと、LexからのTranscribeのときの語彙登録ってできないと思っていたができるぽい。語数も増えてる?
Creating a custom vocabulary to improve speech recognition - Amazon Lex
https://docs.aws.amazon.com/lexv2/latest/dg/vocab.html
Original Link
はい、で、これを超大量のデータで学習しメモリ上に展開されているなにかのデータをなにかのフォーマットでファイルに落としたものがいわゆるLLM(大規模言語モデル)で、ファイルフォーマットが何なのかよくわからないけと末尾に .pthってついてるやつなんだろうな そのあたりを理解したい
【Pytorch】Transformerを実装する - Qiita
https://qiita.com/gensal/items/e1c4a34dbfd0d7449099
Original Link
ii★oka氏お勧めらしい
菊水 鶏白湯 白味噌 - Google 検索 https://www.google.co.jp/search?q=%E8%8F%8A%E6%B0%B4+%E9%B6%8F%E7%99%BD%E6%B9%AF+%E7%99%BD%E5%91%B3%E5%99%8C&ie=UTF-8&oe=UTF-8&hl=ja-jp&client=safari
Original Link
ダブリンのサポートのマネージャー募集してるってw UKだとお給料はそんなに高くないそうです、って言っても今の自分の年俸よりは高そうだが。。どうなんでしょうかね
まあマネジャーでAWSに入るのはコミュニケーション力とか試されそうで、自分が入れる気が全くしませんが。。。わたくし、知り合いに入れてもらう以外で転職したことないし
Original Link
LLMのモデルファイル、ものすごい小さいやつで6GBとかある 普通は30GB
ので、MBA 内蔵SSD 256GBじゃつらい とりあえずParallelsとかのWindowsディスクイメージは捨てた(どうせつかってない やはり外付けLightning接続SSDドライブが必要か。。。
Original Link
MacでChatGPTで日本語IMEでEnterすると送信されてしまう件の対策方法(いまさら
【ChatGPT】Enterで改行せずに、Ctrl+Enterで送信する方法 | ナポリタン寿司のPC日記
https://www.naporitansushi.com/chatgpt-enter-send-disable/
Original Link
トイルとは、サービスの提供に欠かせない作業の中で、自動化が可能であるにも関わらず手作業で行われているものを指します。 例えば手順書のコマンドをコピー&ペーストして実行するだけのような自動化できるような作業
トイル - Google 検索 https://www.google.co.jp/search?q=%E3%83%88%E3%82%A4%E3%83%AB&ie=UTF-8&oe=UTF-8&hl=ja-jp&client=safari
Original Link
@masaka とか言ってたら、軽量なllamaだそうです
Independent implementation of LLaMA that is fully open source under the Apache 2.0 license.
This implementation builds on nanoGPT.
GitHub - Lightning-AI/lit-llama https://github.com/Lightning-AI/lit-llama
Original Link
@masaka しがないメインフレームcobol技術者だった自分が、ダウンサイジング化でsolarisやhp-uxに触れ(でもやってることはcobol)、その後Linux勃興、フリーランスになり自宅dos/vパソコンで各種ディストリいじってたらベンチャーに誘われ、みたいにして今の場所に流れ着いたのが、生成AIでこれからあちこちで同じことが起きようとしているように見えるんだよなー
インフラの話に聞こえるかもだが、自分としては生産技術をやってるつもり
Original Link
まあとりあえずアマコネ(LexからのTranscribe)+GPT3.5-turboでボイスボット立てて社内公開しておいた
Transcribe、思ったよりいいかんじのような気がしますね
あと最近Pollyもニューラル系音源が増えて、だいぶましになってきた
音声入力とGPT応答結果をチャットワークにも流すようにしておいたのでへんなことを言う人がいたらちょっと微妙だがまあいいや だれからかはわからないし(社用携帯からなら特定できちゃうけどねw
Original Link