
テンセントは先日、最新のオープンソーステキストベース画像モデル「HunyuanImage 2.1」を正式にリリースしました。このモデルは、生成品質とパフォーマンスの優れたバランスを実現し、2K解像度の画像生成をネイティブにサポートすることで、デザイナーやビジュアルクリエイターにとってより効率的なクリエイティブツールを提供します。特に、このアップグレードでは中国語と英語の入力機能が強化され、高品質で複雑なセマンティックテキストの生成が可能になり、イラスト、ポスター、コミックなど、多様な作品の制作効率が大幅に向上します。
技術的には、HunyuanImage 2.1は、画像とテキストの膨大なデータセットを活用し、複雑なセマンティック理解とクロスドメイン汎化において飛躍的な進歩を遂げています。このモデルは最大1,000トークンのプロンプト入力をサポートし、シーンの詳細、キャラクターの表情、複数のオブジェクトのインタラクションを正確に制御できます。また、テキストと画像を自然にブレンドするという課題を革新的な方法で解決し、作品全体の美観を大幅に向上させます。コードとウェイトはHugging FaceとGitHubでオープンソース化されており、開発者はこれらを基に開発を進めることができます。
テンセントは、次世代ネイティブマルチモーダル画像生成モデルが研究開発段階に入ったことを発表しました。中国をリードするオープンソース文化画像ソリューションとして、Hunyuan Image 2.1のリリースは、クリエイティブツールの利用ハードルを下げるだけでなく、オープンソースエコシステムを通じてAI生成技術の産業応用イノベーションを促進します。