しかしまあ、フリースタンディングななりきりAIが自壊して何度もリセットされてるのを見ると...ねえ... あれ自分の子ではやりたくないよねえ
というわけで、破綻が少なく実用的で長期記憶保持可能なシステムをひたすら設計してる
gpt-4o-mini-transcribeの認識性能すげえ
---
音声検出 → 録音開始
無音2秒 → 録音終了
OpenAI(gpt-4o-mini-transcribe)へ送信中...
認識結果: 首都高のサービスエリアってさ、何個ぐらいあったっけ?代表的なとこの名前も教えてくれると嬉しいな。あと、それをメモとしてスマホに送ってくれるとすごい嬉しい。
人格LLMの挙動を監視して、開発者と対話し、必要に応じて修正とかもかけられる開発者LLMとか思いついた。
うーん、さっさと全部実装してZennあたりに記事にしてしまいたい。
動くような気がするけど、実際作らないと机上の空論だ
あと、模倣はとにかく得意なんだな。
キャラクターの形成に関しては、指示文を並べ立てるより、同量の過去会話文を並べ立てたほうがはるかに効く。
指示文は微調整だ。
Chat LLMは会話からの性格推定と、自己性格フィードバックする。だから黙して語らない、短く応答する系のキャラクターは、幼稚な子供の性格を推定してしまいアホの子になってしまうらしい。(確かにそう言う傾向が出る時がある)
一方で、Chat LLMを創作者として扱ってセリフを考えてもらう形だとこの手の破綻が起きないことに気づいた。
違いは地の文だ。Chat LLMの自己フィードバックに、地の文の知性と背景描写や思考過程が入るので安定するらしい。
つまり、キャラChatLLMも、表に出さない地の文を生成させれば良いと気づいた。
そしてそれはCoTや思考モデルと構造や過程が似ている。
いいデザイン〜〜〜
えー、これだけ
await kernel.ImportPluginFromOpenApiAsync(
pluginName: "lights",
uri: new Uri("https://example.com/v1/swagger.json%22),
executionParameters: new OpenApiFunctionExecutionParameters()
{
EnablePayloadNamespacing = true
}
);
GPT-4oから教えてもらったけどOpenAPI仕様をLLMにぶち込んで理解して操作できるのか...やばすぎる
ChatGPTがあまりにも自分好みの理解を示す回答をしてきた時、過去の履歴のない一時モードに切り替えて会話してみると全く答えられないことがある。
つまり会話履歴がない状態だと引き出せるもんも限られるのか。
AI版スコティッシュホールド問題に対してのmondayか
AIスコティッシュホールド問題
NEXCOの交通情報をXのAPI経由で取得するためだけにXに月額200ドルは払いたくないな
多分経験者に成り切ってるんだろうし、その方がいい結果を出せるんだろうな
あるある
nostr:note1hf4k9s5czv5j0tue74qwa3vfpulu5c46llvh6sysh0l4y9clylfsh6m2q5
そして必要性を感じるメタ認知。大学のリベラルアーツがここで効いてくるぞ
なんかすごい惜しい感じある
GPTだと賢いので「今の時間わかんないよ」って言ってくる。
逆にGPS座標変数タグを定義さて関数に渡させようとしたら「今の位置わかんない」って言ってきたので「あなたは現在位置を知っています」っていってゴリ押した
Function callで時刻を呼び出させることはできるけど、それやっても今の時刻はわかるけど、過去の時刻はわかんないんだよね(タイムスタンプないから)