ハーバード大が100万冊の本を公開。読むのはAIですけれど
2024.12.15 7:00
Gizmodo.jp
Image:Shutterstockハーバード大学がAIモデルのトレーニング用データセットとして約100万冊のパブリックドメインの書籍を公開したと話題になっています。シェイクスピアやディケンズなどの古典や、チェコの数学教科書、ウェールズ語の辞書といった多岐にわたるジャンルの本が学習されるそうですよ。AIには「権利関係がはっきりしたデータセット」が必要な理由AIは大量のテキストデータを学習することで