言葉の説明によって自動生成するイラストAI「DALL・E(デリー)」

カテゴリーから探す

年別から見る

2021/01/09

言葉の説明によって自動生成するイラストAI「DALL・E(デリー)」

言葉の説明によって自動生成するイラストAI「DALL・E(デリー)」

こちらは人工知能(AI)を研究するOpenAIという団体が2021年1月5日に自然言語処理と画像生成を組み合わせたAIとして「DALL・E(デリー)」という愛称で発表しました。
同団体より開発された、人間の様に高精度な文章を生成することができる「GPT-3」のパラメータを使用し、それによって文章からイラストや写真といった画像を生成することが可能となりました。

ここで使用されている「GPT-3」とは1750億個のパラメータで動作し、いくつかのキーワードを与えると人間が書いたような文章を生成する。その為か、「この言語モデルは危険すぎる」や「新たなブレイクスルーだ」などの議論を生むほどのもので、実際に技術者のマヌエル・アラオス氏が投稿したGPT-3に関するブログを、実は人間ではなくGPT-3が書いたものであることが話題を呼びました。

その言語モデルでありGPT-3を使用した今回の「DALL・E」は学習と推論を経て見たことがないものを予測できる様な技術となっている。

https://openai.com/blog/dall-e/

画像生成例

「ネオンサイン」「openAI」というキーワードを使う事によって下記の様な画像を生成した。

原文：a neon sign that reads ‘openai’.(openaiと読むネオンサイン)

「OpenAI」というネオンサインは現実には存在せず、すべてAIが文章をレンダリングし、作り上げています。

しかし、求められる文字列が長いほど画像生成の成功率は低くなる様です。

その他にもプロダクトデザイン、街の背景や手書きの様なスケッチも生成することが可能となっている。

この様に文章で画像を生成する技術が進歩する事によって起こる社会的影響も多く、特定の業種やサービスにとって将来的に与える影響は重要なものと考えられる。

また、これら社会的影響に関してはopenAIは認識しており、この技術が示唆する長期的な倫理的課題などの社会的課題とどのように関連しているかを分析する予定との事でした。

Author Profile

著者近影

スターフィールド編集部

SHARE

合わせて読みたい

Webアクセシビリティの義務化について調べてみました

2024/04/19

Webアクセシビリティの義務化について調べてみました

ZenStack を使用してデータベーススキーマを作成する

2024/04/05

ZenStack を使用してデータベーススキーマを作成する

認証が必要な Cloud Run サービスにアクセスする方法まとめ

2024/03/15

認証が必要な Cloud Run サービスにアクセスする方法まとめ

Next.jsとCypressを使ったWebアプリでテストのカバレッジ率を計測する

2024/03/01

Next.jsとCypressを使ったWebアプリでテストのカバレッジ率を計測する