東洋経済新報社、テキストデータをVisual Bankを通じAI学習用途として販売開始
東洋経済新報社はVisual Bank株式会社傘下の株式会社アマナイメージズを通じて、データパートナーシップ契約をしました。東洋経済新報社の有するテキスト等の大規模データを、Visual BankのAI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を通じ、AI学習用途に対して販売開始します。
東洋経済新報社とVisual Bankは、AIの研究開発におけるデータの多様性と品質を確保し、イノベーションを加速させることを目的とし、日本市場に向けたAI学習用のテキスト、グラフ等の大規模データの提供を開始します。LLM・生成AI・マルチモーダルAIでの活用を念頭に、良質で信頼性の高い日本語コーパス等を提供することで、日本におけるAIの研究開発を支援していきます。
データパートナーシップ契約の内容
本契約は、東洋経済新報社の有する良質でクローズドなテキスト、グラフ等のデータを、Visual BankのAI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を通じて販売開始するものです。AI開発企業や研究機関に対して提供し、LLM/生成AI/マルチモーダルAIの学習用途にご利用いただくことを想定しています。
Qlean Dataset × 東洋経済新報社のサービス概要
●特長
①東洋経済新報社の過去20年以上の記事テキスト、グラフデータの提供
②LLM/生成AI/マルチモーダルAIの学習用データに使用可能
③専門的なインストラクションデータも作成可能
【LLM(大規模言語モデル)/生成AI/マルチモーダルAIにおける想定ユースケース】
●LLMの開発
高品質な日本語コーパスを利用した汎用性の高いLLM開発、ファインチューニング
経済領域での特化型のLLM開発、ファインチューニング
●図表×テキストのマルチモーダルAIの開発
IR資料、決算資料に関連するマルチモーダルAI
社内パワーポイント資料、エクセル、ワード、PDFなどの資料に関連するマルチモーダルAI