Talkie-1930:1930 AIがベンチマークを粉砕
目次
Talkie-1930 と ALT の歴史的汎化
歴史の埃っぽいページから生まれた人工知能が、現代のベンチマークのすべての汚れを拭い去り、注目を集めています。Talkie-1930という名前の13億パラメータのオープンウェイト言語モデルは、1931年1月1日以前に出版された260億トークンのテキストで訓練されました。本、新聞、科学雑誌、特許、裁判記録などのパブリックドメインソースが使用されました。この厳格なカットオフ日付は、テストデータのトレーニングセットへの漏洩を最初から防ぎ、AIの汎化研究を完璧にします。Claude Sonnet 4.6を継続的にプロンプトして動作させるモデルは、ALT 詳細分析の愛好家にとってインスピレーションを与える例で、talkie-lm.com/chat で誰でもアクセス可能です。

Talkie-1930 の予測と ALT の金融的視点
Nick Levine、David Duvenaud、Alec Radfordが率いる非営利チームは、Anthropicの計算支援により2つのチェックポイントを公開しました:自動補完のためのベースバージョンとチャット指向の指示調整バージョンで、両方ともApache 2.0ライセンスの下でHugging Faceで利用可能です。モデルはインターネット、冷戦、ペニシリン、またはALT 先物取引のような暗号通貨の概念を一切知りません。医学知識は1930年代に限定されています。ヒトラーの台頭について尋ねると、ドイツの野党の弱さを指摘し、王政の予測をしました。思考する機械の記述では言語障壁を最大の障害と見なしました。金融危機の真っ只中で訓練されたため、鉄道株、鉱山コンソーシアム、産業企業を提案しました:Canadian Pacific Railway、De Beersなどの名前です。2026年の予測はユートピア的で、軍隊と犯罪が減少するはずでしたが、文が途中で切れました。


Talkie-1930 の ALT に対する意味
Talkie-1930は、データ汚染を排除することでAIの抽象化能力を測定する扉を開き、カットオフ後の出来事への反応は1950-60年代にピークを迎えます。ウェブ外の訓練は、モデルのアイデンティティを根本から問い直し、数兆トークン規模のChatGPTのようなビンテージモデルを2026年夏まで約束します。AI分野でデータ的新鮮さと歴史的文脈の限界を再定義するこの取り組みは、汎化研究に新たな息吹をもたらします。

