IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社Nooblの特許一覧

特許7462991絵本生成システム、絵本生成プログラム及び絵本生成方法
<>
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図1
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図2
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図3
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図4
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図5
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図6
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図7
  • 特許-絵本生成システム、絵本生成プログラム及び絵本生成方法 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-03-29
(45)【発行日】2024-04-08
(54)【発明の名称】絵本生成システム、絵本生成プログラム及び絵本生成方法
(51)【国際特許分類】
   G06F 40/56 20200101AFI20240401BHJP
   G06T 11/60 20060101ALI20240401BHJP
【FI】
G06F40/56
G06T11/60 100A
【請求項の数】 11
(21)【出願番号】P 2023110319
(22)【出願日】2023-07-04
【審査請求日】2023-07-04
【早期審査対象出願】
(73)【特許権者】
【識別番号】523254427
【氏名又は名称】株式会社Noobl
(74)【代理人】
【識別番号】110004163
【氏名又は名称】弁理士法人みなとみらい特許事務所
(72)【発明者】
【氏名】廣瀬 晃
【審査官】長 由紀子
(56)【参考文献】
【文献】米国特許出願公開第2022/0254188(US,A1)
【文献】米国特許出願公開第2008/0235576(US,A1)
【文献】特開2003-157252(JP,A)
【文献】特開2023-000312(JP,A)
【文献】本多 夏音 外3名,AIを活用した絵本の半自動生成試行 Trial for semi-automatic generation of a picture book using AI,情報処理学会 研究報告 エンタテインメントコンピューティング(EC) 2022-EC-65 [online] ,日本,情報処理学会,2022年09月29日,pp.1-6
【文献】五木 宏 外4名,ストーリー型コンテンツ制作支援AIフルコト Story-based Content Creation Support AI FURUKOTO,情報処理学会 シンポジウム じんもんこんシンポジウム 2022 [online] ,日本,情報処理学会,2022年12月02日,pp.45-52
【文献】pusai,AI技術フル活用講座 翻訳&要約から小説の執筆までお任せ! テキスト系AIサービス,ラジオライフ ,日本,三才ブックス,2023年03月25日, 第44巻 第6号 ,pp.84-85
【文献】第6章 カメラ&写真 Section060 ちょっと凝った写真を撮る,今すぐ使えるかんたんPLUS+ iPadアプリ完全大事典 ,日本,株式会社技術評論社,2014年12月05日,pp.134-135
【文献】福田 清人 外3名,機械学習に基づく対話システムを導入した絵本の半自動生成 Semi-automatic Picture Book Generation with Interaction System based on Machine Learning,一般社団法人 人工知能学会 第31回全国大会論文集DVD [DVD-ROM],日本,一般社団法人人工知能学会,2017年05月23日,pp.1-4
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-56
G06T 11/60
(57)【特許請求の範囲】
【請求項1】
絵本の生成を行う絵本生成システムであって、
受付手段と、イラスト化手段と、物語化手段と、統合化手段と、を備え、
前記受付手段は、複数の写真、及び、テキスト受け付け、
前記イラスト化手段は、前記複数の写真を、学習済みの機械学習モデルであるイラスト生成手段に送信し、
前記物語化手段は、前記テキストを、学習済みの機械学習モデルである物語生成手段に送信し、
前記イラスト生成手段は、前記複数の写真を用いて複数のイラストを生成し、
前記物語生成手段は、前記テキストを用いて物語を生成し、
前記統合化手段は前記物語生成手段が生成した物語を前記複数のイラストに1対1で対応するように分割し、該分割した物語を該複数のイラストそれぞれに1対1で対応させて、該物語と該イラストとの統合を行い、絵本データを生成する、
絵本生成システム。
【請求項2】
前記物語生成手段は、大規模言語モデルである、
請求項1に記載の絵本生成システム。
【請求項3】
前記絵本生成システムは、更に、記憶部と、を備え、
前記記憶部は、前記イラストの方向性を指定する情報であるイラスト化パターン情報と、前記物語の方向性を指定する情報である物語化あらすじ情報と、を記憶し、
前記受付手段は、更に、ユーザからユーザ端末を介して、前記イラスト化パターン情報及び前記物語化あらすじ情報を受け付け、
前記イラスト化手段は、更に、前記ユーザから受け付けたイラスト化パターン情報を前記イラスト生成手段に送信し、
前記物語化手段は、更に、前記ユーザから受け付けた物語化あらすじ情報を前記物語生成手段に送信し、
前記イラスト生成手段は、更に、前記イラスト化パターン情報を用いて複数のイラストを生成し、
前記物語生成手段は、更に、前記ユーザから受け付けた物語化あらすじ情報を用いて物語を生成する、
請求項に記載の絵本生成システム。
【請求項4】
前記絵本生成システムは、更に、記憶部と、を備え、
前記記憶部は、前記絵本に登場する人物が写っている登場人物設定写真を記憶し、更に、該登場人物設定写真に写っている人物の名前である登場人物名前を紐づけて記憶し、
前記受付手段は、絵本に登場する場面が写っている場面設定写真を受け付け、更に、顔認識技術によって、前記登場人物設定写真から場面設定写真に写っている人物を検出し、
前記イラスト化手段は、前記場面設定写真を、前記イラスト生成手段に送信し、
前記物語化手段は、更に、前記顔認識技術で検出した人物が写っている登場人物設定写真に紐づく登場人物名前を、前記物語生成手段に送信し、
前記イラスト生成手段は、前記場面設定写真を用いてイラストを生成し、
前記物語生成手段は、更に、前記登場人物名前を用いて物語を生成する、
請求項1に記載の絵本生成システム。
【請求項5】
前記記憶部は、更に、前記登場人物名前にその人物の役割を紐づけて記憶し、
前記物語化手段は、更に、前記受付手段が検出した人物の役割を、前記物語生成手段に送信し、
前記物語生成手段は、更に、前記役割を用いて物語を生成する、
請求項4に記載の絵本生成システム。
【請求項6】
前記絵本生成システムは、更に、記憶部と、を備え、
前記記憶部は、前記物語の文字数を制御する文字数制御情報、前記物語の文字の種類をひらがなに指定するひらがな化情報又は前記物語に使用できない単語を指定する禁則情報の少なくとも1つを記憶し、
前記受付手段は、更に、前記記憶部が前記文字数制御情報を記憶する場合、ユーザからユーザ端末を介して、前記文字数制御情報を受け付け、
前記物語化手段は、更に、前記受付手段が前記文字数制御情報を受け付けた場合、前記文字数制御情報を前記物語生成手段に送信し、更に、前記記憶部が前記ひらがな化情報又は前記禁則情報を記憶する場合、前記ひらがな化情報又は前記禁則情報を前記物語生成手段に送信し、
前記物語生成手段は、更に、前記文字数制御情報、前記ひらがな化情報又は前記禁則情報の少なくとも1つを用いて物語を生成する、
請求項に記載の絵本生成システム。
【請求項7】
前記統合は、機械学習モデルが行う、
請求項に記載の絵本生成システム。
【請求項8】
前記絵本生成システムは、更に、記憶部と、を備え、
前記記憶部は、更に、しつけ、マナー又はルールに関するイラスト及び物語の生成指示を生成するための情報を、前記しつけ、マナー又はルールに関するテーマに紐づけて記憶し、
前記受付手段は、更に、ユーザからユーザ端末を介して、前記テーマを受け付け、
前記イラスト化手段は、更に、前記テーマに紐づくイラストの方向性の指示を前記イラスト生成手段に送信し、
前記物語化手段は、更に、前記テーマに紐づく物語の方向性の指示を前記物語生成手段に送信し、
前記イラスト生成手段は、更に、前記テーマに紐づくイラストの方向性の指示を用いてイラストを生成し、
前記物語生成手段は、更に、前記テーマに紐づく物語の方向性の指示を用いて物語を生成する、
請求項に記載の絵本生成システム。
【請求項9】
前記イラスト生成手段は、大規模言語モデルである、
請求項1に記載の絵本生成システム。
【請求項10】
絵本の生成を行う絵本生成プログラムであって、
コンピュータを、受付手段と、イラスト化手段と、物語化手段と、統合化手段と、として機能させ、
前記受付手段は、複数の写真、及び、テキスト受け付け、
前記イラスト化手段は、前記複数の写真を、学習済みの機械学習モデルであるイラスト生成手段に送信し、
前記物語化手段は、前記テキストを、学習済みの機械学習モデルである物語生成手段に送信し、
前記イラスト生成手段は、前記複数の写真を用いて複数のイラストを生成し、
前記物語生成手段は、前記テキストを用いて物語を生成し、
前記統合化手段は前記物語生成手段が生成した物語を前記複数のイラストに1対1で対応するように分割し、該分割した物語を該複数のイラストそれぞれに1対1で対応させて、該物語と該イラストとの統合を行い、絵本データを生成する、
絵本生成プログラム。
【請求項11】
絵本の生成を行う絵本生成方法であって、
コンピュータが、受付工程と、イラスト化工程と、物語化工程と、統合化工程と、を実行し、
前記受付工程において、複数の写真、及び、テキスト受け付け、
前記イラスト化工程において、前記複数の写真を、学習済みの機械学習モデルであるイラスト生成手段に送信し、
前記物語化工程において、前記テキストを、学習済みの機械学習モデルである物語生成手段に送信し、
前記イラスト生成手段は、前記複数の写真を用いて複数のイラストを生成し、
前記物語生成手段は、前記テキストを用いて物語を生成し、
前記統合化工程において前記物語生成手段が生成した物語を前記複数のイラストに1対1で対応するように分割し、該分割した物語を該複数のイラストそれぞれに1対1で対応させて、該物語と該イラストとの統合を行い、絵本データを生成する、
絵本生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、絵本生成システム、絵本生成プログラム及び絵本生成方法に関する。
【背景技術】
【0002】
従来、撮影した写真を用いて、本を作成する技術が存在する。
【0003】
例えば、特許文献1には、「サーバ装置1は、画像を選択してフォトブックデータを作成する際に、選択した画像に対し、コメント(又はタイトル)を生成して付与できる。サーバ装置1は、画像解析により検出された画像内の物体やテキスト、フォトブックの目的等に基づいて、コメントを生成する。例えば、サーバ装置1は、特徴的な物体が検出された画像に対してコメントを生成して付与する」(0039)ことが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特許7091890号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1の技術では、撮影した写真に対してコメントを付与してフォトブックを作成できる。しかしながら、写真に対して適切なイラスト化を施し、更に、ユーザが入力した情報から絵本に適した物語を生成することは困難である。
【0006】
本発明は、上記従来技術の課題に鑑みて行われたものであって、その目的は、ユーザが撮影した写真及びユーザが入力した情報を用いて、イラスト及びイラストに適した物語を有する絵本を生成する技術を提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明は、絵本の生成を行う絵本生成システムであって、
受付手段と、イラスト化手段と、物語化手段と、統合化手段と、を備え、
前記受付手段は、写真、テキスト、テーマの少なくとも1つを含むユーザ入力情報を受け付け、
前記イラスト化手段は、前記ユーザ入力情報を用いてイラストの生成指示をイラスト生成手段に送信し、
前記物語化手段は、前記ユーザ入力情報を用いて物語の生成指示を物語生成手段に送信し、
前記統合化手段は、前記イラスト生成手段が生成したイラスト及び前記物語生成手段が生成した物語の統合を行い、絵本データを生成する。
【0008】
このような構成とすることで、ユーザが撮影した写真を用いて、絵本を生成することができる。
【0009】
本発明の好ましい形態では、前記イラスト生成手段は、機械学習モデルであり、
前記物語生成手段は、大規模言語モデルである。
【0010】
このような構成とすることで、絵本のためのイラスト及び物語を簡易に生成することができる。
【0011】
本発明の好ましい形態では、前記絵本生成システムは、更に、記憶部と、を備え、
前記記憶部は、前記イラストの方向性を指定する情報であるイラスト化パターン情報と、前記物語の方向性を指定する情報である物語化あらすじ情報と、を記憶し、
前記イラスト化手段は、更に、前記イラスト化パターン情報を前記イラスト生成手段に送信し、
前記物語化手段は、更に、前記物語化あらすじ情報を前記物語生成手段に送信する。
【0012】
このような構成とすることで、ユーザの好みに合う絵本のためのイラスト及び物語を生成することができる。
【0013】
本発明の好ましい形態では、前記受付手段は、1枚の写真に対応するテキストとして1つの短文を受け付け、
前記イラスト化手段は、前記1枚の写真を用いてイラストの生成指示を前記イラスト生成手段に送信し、
前記物語化手段は、前記1つの短文を用いて物語の生成指示を前記物語生成手段に送信し、
前記統合化手段は、前記イラスト生成手段が生成した1枚のイラスト及び前記物語生成手段が生成した物語の統合を行い、絵本データを生成する。
【0014】
このような構成とすることで、イラストに対応する物語の統合を行うことができる。
【0015】
本発明の好ましい形態では、前記記憶部は、更に、前記物語の文字数を制御する文字数制御情報、前記物語の文字の種類をひらがなに指定するひらがな化情報又は前記物語に使用できない単語を指定する禁則情報の少なくとも1つを記憶し、
前記物語化手段は、更に、前記文字数制御情報、前記ひらがな化情報又は前記禁則情報の少なくとも1つを前記物語生成手段に送信する。
【0016】
このような構成とすることで、絵本に適した物語の生成を行うことができる。
【0017】
本発明の好ましい形態では、前記写真は、前記物語に登場する登場人物の候補が写っている登場人物設定写真を含み、
前記記憶部は、更に、前記登場人物設定写真に前記登場人物の名前である登場人物名前を紐づけて記憶する。
【0018】
このような構成とすることで、ユーザは登場人物の名前を毎回入力する必要が無い。
【0019】
本発明の好ましい形態では、前記統合は、機械学習モデルが行う。
【0020】
このような構成とすることで、イラスト及び物語の統合を簡易に行うことができる。
【0021】
本発明の好ましい形態では、前記記憶部は、更に、しつけ、マナー又はルールに関するテンプレート情報を前記テーマに紐づけて記憶する。
【0022】
このような構成とすることで、しつけ、マナー又はルールに関する絵本の生成を行うことができる。
【0023】
本発明の好ましい形態では、前記受付手段は、写真、テキストとして短文を受け付け、
前記イラスト化手段は、前記写真を用いてイラストの生成指示を前記イラスト生成手段に送信し、
前記物語化手段は、前記短文を用いて物語の生成指示を前記物語生成手段に送信し、
前記統合化手段は、前記物語生成手段が生成した物語を分割して、前記イラスト生成手段が生成したイラストとの統合を行い、絵本データを生成する。
【0024】
このような構成とすることで、絵本を簡易に生成することができる。
【発明の効果】
【0025】
本発明によれば、ユーザが撮影した写真及びユーザが入力した情報を用いて所定の処理を実行することで、絵本生成システムに係る新規な技術を提供することができる。
【図面の簡単な説明】
【0026】
図1】本実施形態の絵本生成システムのブロック図。
図2】本実施形態のハードウェア構成図。
図3】本実施形態のデータ構成の一例。
図4】本実施形態のデータ構成の一例。
図5】本実施形態の絵本生成の処理シーケンス図。
図6】本実施形態の絵本生成のためのユーザ入力情報の入力画面の一例。
図7】本実施形態の絵本生成のためのユーザ入力情報の入力画面の一例。
図8】本実施形態の絵本生成システムのブロック図。
【発明を実施するための形態】
【0027】
以下、図面を用いて、本発明の実施形態に関する絵本生成システムについて説明する。なお、以下に示す実施形態は本発明の一例であり、本発明を以下の実施形態に限定するものではなく、様々な構成を採用することもできる。
【0028】
本実施形態では、絵本生成システム、絵本生成装置及び絵本生成プログラムの構成、動作等について説明するが、同様の構成の方法、コンピュータのプログラムおよび当該プログラムを記録したプログラム記録媒体等も、同様の作用効果を奏する。プログラム記録媒体を用いれば、例えば、コンピュータに当該プログラムをインストールすることができる。以下で説明する本実施形態にかかる一連の処理は、コンピュータで実行可能なプログラムとして提供され、CD-ROMやフレキシブルディスクなどの非一過性コンピュータ可読記録媒体、更には通信回線を経て提供可能である。
【0029】
絵本生成システムは、コンピュータ装置により構成される。コンピュータ装置は、CPU(Central Processing Unit)などの演算装置および記憶装置を有する。当該コンピュータ装置は、記憶装置に格納される絵本生成プログラムを、演算装置により実行することで、当該コンピュータ装置を絵本生成装置として機能させることができる。絵本生成方法は、絵本生成装置を含むコンピュータ装置の処理により実現される。
【0030】
本実施形態において、絵本生成システムは、ユーザによる入力に対して、出力として絵本を提供する。ユーザによる入力は、写真、短文又はテーマ等を例示できるがこれらに限定されない。
【0031】
<実施形態1>
図1は、実施形態1における絵本生成システム1のブロック図を示す。絵本生成システム1は、絵本生成装置2と、ユーザ端末3と、イラスト生成装置4と、物語生成装置5と、を備え、これらの構成部は、通信ネットワークNWを介して通信可能に接続されている。さらに、絵本生成装置2は、有線又は無線で記憶部6に接続されている。
【0032】
絵本生成装置2は、機能構成要素として、ユーザからユーザ入力情報を受け付ける受付手段21と、イラストの生成指示を送信するイラスト化手段22と、物語の生成指示を送信する物語化手段23と、イラスト及び物語の統合を行う統合化手段24と、を備える。これら機能構成要素の配置は一例であり、絵本生成装置2の備えた機能構成の一部が、絵本生成装置2と通信可能に構成された1又は複数の装置に配置されても良い。
【0033】
絵本生成装置2は、ユーザ端末3よりユーザ入力情報を受信する。絵本生成装置2は、受信したユーザ入力情報を用いてイラストの生成指示をイラスト生成装置4に送信する。絵本生成装置2は、生成されたイラストをイラスト生成装置4より受信する。絵本生成装置2は、受信したユーザ入力情報を用いて物語の生成指示を物語生成装置5に送信する。絵本生成装置2は、生成された物語を物語生成装置5より受信する。絵本生成装置2は、受信したイラスト及び物語の統合を行い、絵本データを生成する。
【0034】
絵本生成装置2は、具体的には、テキスト、写真をイラストの生成指示としてイラスト生成装置4に送信する。絵本生成装置2は、例えば、ユーザから選択された選択肢に紐づく情報及びユーザから入力された情報を用いてプロンプトを生成し、プロンプト及びユーザから受け付けた写真をイラスト生成装置4に送信する。
【0035】
絵本生成装置2は、具体的には、テキストを物語生成装置5に送信する。絵本生成装置2は、例えば、ユーザから選択された選択肢に紐づく情報及びユーザから入力された情報を用いてプロンプトを生成し、プロンプトを物語生成装置5に送信する。物語生成装置5は、ChatGPT等である。
【0036】
ユーザは、ユーザ端末3を介して、写真、テキスト、テーマの少なくとも1つを含むユーザ入力情報を入力又は送信することができる。ユーザ端末3は、絵本に登場する人物の名前等を含む登場人物設定写真情報を送信することができる。ユーザ端末3は、ユーザの名前、住所、電話番号等を含むユーザ基本情報を送信することができる。ユーザ端末3は、ディスプレイ等の表示部に生成されるイラスト及び物語を含む絵本の場面を画面に表示することができる。ユーザ端末3は、図1において、1つのみ示したが、複数存在しても良い。
【0037】
イラスト生成装置4は、機能構成要素として、イラスト生成手段41を備える。イラスト生成手段41は、イラストの生成指示に含まれるユーザ入力情報を用いてイラストを生成し、生成したイラストを、イラストの生成指示の送信元に送信する。本実施形態において、イラストの生成指示の送信元は、絵本生成装置2であるが、これに限定されず、ユーザ端末3とする態様を採用することもできる。
【0038】
本実施形態において、イラスト生成手段41は、機械学習モデルである。絵本生成装置2より受信したユーザ入力情報を、ニューラルネットワーク等の機械学習モデルによって、イラスト化する。イラスト生成手段41は、大規模言語モデル(LLM(Large Language Model))であっても良い。
【0039】
物語生成装置5は、機能構成要素として、物語生成手段51を備える。物語生成手段51は、物語の生成指示に含まれるユーザ入力情報を用いて物語を生成し、生成した物語を、物語の生成指示の送信元に送信する。本実施形態において、物語の生成指示の送信元は、絵本生成装置2であるが、これに限定されず、ユーザ端末3とする態様を採用することもできる。
【0040】
本実施形態において、物語生成手段51は、大規模言語モデルである。物語生成手段51に対して、テキストがプロンプトとして入力されると、物語生成手段51は物語を生成する。例えば、絵本生成装置2より受信したユーザ入力情報が1つの短い文章である場合、その短い文章を基に物語を生成する。物語生成手段51は、ニューラルネットワーク等の機械学習モデルであっても良い。
【0041】
記憶部6は、イラスト生成手段41に対して生成するイラストの方向性を促すための情報であるイラスト化パターン情報、物語生成手段51に対して生成する物語の方向性を促すための情報である物語化あらすじ情報、絵本に登場する登場人物を設定するための情報である登場人物設定写真情報、絵本に適した文字数に制御するための情報である文字数制御情報、絵本に適した文字にするための情報であるひらがな化情報、絵本に適さない用語及び表現を使用しないための情報である禁則情報、を格納する。さらに、記憶部6は、しつけ、マナー、ルールに関する絵本を生成するための情報であるテンプレート情報を格納する。記憶部6が格納する情報は、ユーザ入力情報として用いられる。また、記憶部6に格納されたデータの一部又は全部が、絵本生成システム1と通信可能に構成された1又は複数の装置に格納されても良い。
【0042】
図2(a)は、絵本生成装置2のハードウェア構成図を示す。絵本生成装置2は、ハードウェア構成として、制御部201と、記憶部202と、通信部203と、を備える。本実施形態において、絵本生成装置2は、サーバ装置、パーソナルコンピュータ等のコンピュータ装置を用いることができる。なお、絵本生成装置2は、複数のコンピュータにより構成され、全体として上述の機能構成要素(21-24)を実現できれば良く、図2(a)に示す構成に限定されない。
【0043】
制御部201は、CPUなどの1つ以上のプロセッサにより構成され、絵本生成プログラムやOS(Operating System)、その他のアプリケーションを実行することで、絵本生成装置2における全体処理を制御する。記憶部202は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ、RAM(Random Access Memory)等であって、絵本生成プログラム及び各種データを記憶する。通信部203は、通信ネットワークNWとの通信制御を行い、ユーザ端末3、イラスト生成装置4及び物語生成装置5とのデータ通信を実現する。
【0044】
イラスト生成装置4及び物語生成装置5は、絵本生成装置2と同様のハードウェア構成を備えるものであって良い。また、イラスト生成装置4及び物語生成装置5は、絵本生成装置2と同様のコンピュータ装置に実装されても良い。さらに、イラスト生成手段41及び物語生成手段51は、絵本生成装置2の機能構成要素として実現されても良い。
【0045】
図2(b)は、ユーザ端末3のハードウェア構成図を示す。ユーザ端末3は、ハードウェア構成として、制御部301と、記憶部302と、通信部303と、入力部304と、表示部305と、を備える。本実施形態において、ユーザ端末3は、スマートフォン、パーソナルコンピュータ、タブレット端末などを用いることができる。
【0046】
制御部301は、CPUなどの1つ以上のプロセッサにより構成され、OS、その他のアプリケーションを実行することで、ユーザ端末3における全体処理を制御する。記憶部302は、HDD、SSD、フラッシュメモリ、RAMなどであって、ブラウザアプリケーション、および各種データを記憶する。通信部303は、通信ネットワークNWとの通信制御を行い、少なくとも絵本生成装置2とのデータ通信を実現する。入力部304は、ユーザによる入力操作を受け付ける入力インターフェイスであって、タッチパネル、マウス、キーボードなどにより構成される。表示部305は、制御部301による処理結果を表示するディスプレイなどにより構成される。
【0047】
図3及び4は、記憶部に格納されたデータ構成の一例を示す。記憶部6は、図3及び4のようなデータを格納する。
【0048】
受付手段21は、ユーザからユーザ端末3を介して、ユーザ入力情報を受け付ける。ユーザ入力情報は、絵本データを生成するために利用する情報であって、写真、テキスト、テーマの少なくとも1つを含む。写真は、人が写っている写真、写っていない写真のどちらでも良い。写真は、後述する登場人物設定写真又は場面設定写真である。また、テキストは、文章又は単語である。文章は、短くても長くても良いし、1つ又は複数のどちらでも良い。単語は、1つ又は複数のどちらでも良い。テーマは、しつけ、マナー又はルールに関するものである。マナー又はルールは、一般的なもの又は保育園、幼稚園等の特定の施設に関するものである。
【0049】
イラスト化手段22は、受付手段21が受け付けたユーザ入力情報を用いてイラストの生成指示をイラスト生成手段41に送信する。
【0050】
イラスト化手段22は、具体的には、イラスト化パターン情報又はテンプレート情報が有する情報を用いてイラストの生成指示としてプロンプトを生成し、生成したプロンプト及びユーザから受け付けた写真をイラスト生成手段41に送信する。
【0051】
物語化手段23は、受付手段21が受け付けたユーザ入力情報を用いて物語の生成指示を物語生成手段51に送信する。
【0052】
物語化手段23は、具体的には、物語化あらすじ情報、文字数制御情報、ひらがな化情報、禁則情報、テンプレート情報が有する情報を用いて物語の生成指示としてプロンプトを生成し、生成したプロンプトを物語生成手段51に送信する。
【0053】
統合化手段24は、イラスト生成手段41が生成したイラスト及び物語生成手段51が生成した物語の統合を行い、絵本データを生成する。
【0054】
受付手段21は、更に、ユーザからユーザ端末3を介して、ユーザ基本情報を受け付ける。ユーザ基本情報は、ユーザの名前、住所、電話番号等のユーザに関する基本的な情報である。記憶部6は、図3(a)のように、受け付けたユーザ基本情報をユーザIDに紐づけて格納する。
【0055】
受付手段21は、絵本に登場する人物が写っている登場人物設定写真を受け付ける。記憶部6は、登場人物設定写真を含む登場人物設定写真情報を格納しても良い。記憶部6が、図3(b)のように、登場人物設定写真情報を記憶しておくことによって、イラスト化手段22及び物語化手段23は、ユーザ入力情報として登場人物設定写真情報を用いることができる。
【0056】
記憶部6が、図3(b)のように、登場人物設定写真をユーザIDに紐づけて格納しておくことによって、ユーザは、登場人物設定写真を何度も入力する必要がなくなる。記憶部6は、更に、図3(b)のように、登場人物設定写真に写っている人物の名前も格納する。登場人物設定写真に複数の人物が写っている場合、それぞれの名前を紐づけて格納しても良い。また、記憶部6は、図3(b)のように、登場人物設定写真に写っている人物の名称を格納しても良い。登場人物が写っている写真に紐づけてその登場人物の名前又は名称を格納することによって、絵本に登場する人物の入力と同時に、物語における呼ばれ方が決定する。これによって、ユーザが毎回登場人物の名前又は名称を入力する必要がなくなる。さらに、記憶部6は、図3(b)のように、登場人物設定写真に写っている人物の役割を格納しても良い。役割として主人公又はサブキャラを格納することによって、両者が登場する場合、役割に応じた物語が生成される。例えば、役割が主人公の人物が物語に登場する場合、その主人公を中心にした物語が生成される。
【0057】
受付手段21は、絵本に登場する場面が写っている場面設定写真を受け付ける。場面設定写真には、人物が写っていても良いし、写っていなくても良い。場面設定写真に人物が写っている場合、受付手段21は、登場人物設定写真及び場面設定写真を利用し、顔認識技術によって、場面設定写真に写っている人物を検出しても良い。登場人物設定写真から場面設定写真に写っている人物を検出することによって、ユーザは、登場人物設定写真を選択する必要が無くなる。また、ユーザは、登場人物設定写真情報が有する名前、年齢、役割、名称を入力する必要が無くなる。
【0058】
ユーザ入力情報は、登場人物設定写真情報を含んで良いため、イラスト化手段22は、登場人物設定写真又は/及び場面設定写真を用いてイラストの生成指示をイラスト生成手段41に送信しても良い。
【0059】
ユーザ入力情報は、登場人物設定写真情報を含んで良いため、物語化手段23は、登場人物設定写真情報に含まれる名前、年齢、役割、名称を用いて物語の生成指示を物語生成手段51に送信しても良い。
【0060】
受付手段21は、更に、ユーザからユーザ端末3を介して、ユーザ入力情報としてイラスト化パターン情報が有するイラストの方向性の選択を受け付ける。イラストの方向性は、ユーザからテキストの入力によって受け付けても良い。記憶部6は、図3(c)のように、イラストの方向性に紐づけて指示を格納する。受付手段21が、ユーザからイラストの方向性の入力を受け付けると、イラスト化手段22は、イラストの方向性に紐づく指示を用いてイラストの生成指示をイラスト生成手段41に送信する。例えば、イラスト化手段22は、イラストの方向性に紐づく指示を用いてプロンプトを生成し、イラスト生成手段41にユーザから受け付けた写真及びプロンプトを送信する。イラスト生成手段41は、イラストの方向性の指示に沿ったイラストを生成する。図3(c)のイラストの方向性の指示は一例であり、イラストの方向性に適したイラストの生成をイラスト生成手段41に促すような指示であれば良い。
【0061】
受付手段21は、更に、ユーザからユーザ端末3を介して、ユーザ入力情報として物語化あらすじ情報が有する物語の方向性の選択を受け付ける。物語の方向性は、ユーザからテキストの入力によって受け付けても良い。記憶部6は、図3(d)のように、物語の方向性に紐づけて指示を格納する。受付手段21が、ユーザから物語の方向性の入力を受け付けると、物語化手段23は、物語の方向性に紐づく指示を用いて物語の生成指示を物語生成手段51に送信する。例えば、物語化手段23は、物語の方向性に紐づく指示を用いてプロンプトを生成し、物語生成手段51にプロンプトを送信する。物語生成手段51は、物語の方向性の指示に沿った物語を生成する。図3(d)の物語の方向性の指示は一例であり、物語の方向性に適した物語の生成を物語生成手段51に促すような指示であれば良い。
【0062】
物語化手段23は、更に、物語の文字数を制御する文字数制御情報を物語生成手段51に送信する。文字数制御情報として、予め1つの指示が定められ、物語化手段23がその指示を送信しても良い。この他に、ユーザがいくつかのパターンから文字数を選択できても良い。例えば、記憶部6が、図3(e)のように、文字数に紐づけて指示を格納することによって、ユーザが文字数を選択し、物語化手段23が文字数の指示を用いて物語の生成指示を物語生成手段51に送信する。図3(e)の文字数の指示は一例であり、指定される文字数の物語の生成を物語生成手段51に促すような指示であれば良い。この他にも、ユーザが任意の文字数を入力しても良く、任意の文字数以下の物語の生成指示を物語生成手段51に送信する。例えば、記憶部6が、文字数の指示として「X文字以下の物語を生成」を格納し、物語化手段23は、ユーザから入力された文字数をXに代入した指示を物語生成手段51に送信する。ユーザが任意の文字数を入力しても良い場合、その文字数の上限が指示に含められていても良い。
【0063】
物語化手段23は、更に、物語の文字の種類をひらがなに指定するひらがな化情報を物語生成手段51に送信する。ひらがな化情報として、「全文ひらがなの物語を生成」のような予め1つの指示が定められ、物語化手段23がその指示を送信しても良い。この他に、ユーザがいくつかのパターンからひらがな化情報を選択できても良い。例えば、記憶部6が、図3(f)のように、文字種類に紐づけて指示を格納することによって、ユーザが文字種類を選択し、物語化手段23が文字種類の指示を用いて物語の生成指示を物語生成手段51に送信する。図3(f)の文字種類の指示は一例であり、指定される文字種類の物語の生成を物語生成手段51に促すような指示であれば良い。この他にも、ユーザが小学校等の学年を選択することによって、物語化手段23が、その学年までに習う漢字を用いた物語の生成指示を物語生成手段51に送信しても良い。例えば、小学校2年生が選択された場合、物語化手段23は、「小学校2年生までに習う漢字の使用は可能」のような指示を物語生成手段51に送信する。
【0064】
物語化手段23は、更に、物語に使用できない単語を指定する禁則情報を物語生成手段51に送信する。例えば、記憶部6が、図3(g)のように、禁則事項に紐づけて指示を格納することによって、物語化手段23が禁則事項の指示を用いて物語の生成指示を物語生成手段51に送信する。図3(g)に記載の禁則事項の指示の他に、「宗教上の問題になるである表現の使用を禁止」のような指示を物語生成手段51に送信しても良い。この他にも、ユーザから物語に使用できない単語を受け付け、物語化手段23が、物語においてその単語を使用しないように促す指示を物語生成手段51に送信しても良い。
【0065】
記憶部6は、図4(a)のように、テンプレート情報として、テーマに紐づけてイラスト及び物語の指示を格納する。受付手段21が、ユーザからユーザ端末3を介して、ユーザ入力情報としてテーマを受け付けることによって、イラスト化手段22及び物語化手段23が、それぞれのテーマに紐づく指示をイラスト生成手段41及び物語生成手段51に送信する。
【0066】
図5は、絵本生成の処理シーケンス図を示す。ステップS501において、ユーザはユーザ端末3を介して、ユーザ入力情報を入力する。
【0067】
図6は、思い出に関する絵本生成のためのユーザ入力情報の入力画面の一例を示す。ユーザは、W61のように、登場人物設定を行う。記憶部6が登場人物設定写真を格納している場合、ユーザは、ユーザ入力情報として、P61a又はP61bのような登場人物設定写真を選択して入力することができる。記憶部6が登場人物設定写真を格納していない場合、受付手段21が、新たに登場人物設定写真を受け付けても良い。図6のP61aは、図3(b):Taro1.jpgに対応し、図6のP61bは、図3(b):Taro2.jpgに対応する。ユーザが、絵本に登場させる人物としてP61aを選択することによって、イラスト化手段22が、対応するTaro1.jpgをイラスト生成手段41に送信する。写真のファイル形式は、PNG、GIF等でも良く、その形式の指定はない。また、P61aが選択されると、物語化手段23は、Taro1.jpgに紐づく名前等の情報を物語生成手段51に送信する。ユーザは、登場人物設定写真を1枚だけ入力可能でも良いし、複数枚入力可能でも良い。
【0068】
ユーザは、W62のように、絵本の場面設定を行う。場面設定では、図6のP62a及びT62a、P62b及びT62b、・・・のように、受付手段21は、1枚の写真に対応する1つのテキストを受け付けても良い。図6では、テキストは1つの短文である。イラスト化手段22は、受け付けた1枚の写真であるP62aを用いてイラストの生成指示をイラスト生成手段41に送信する。さらに、物語化手段23は、受け付けた1つの短文であるT62aを用いて物語の生成指示を物語生成手段51に送信する。統合化手段24は、イラスト生成手段41が生成した1枚のイラスト及び物語生成手段51が生成した物語の統合を行い、絵本データを生成する。また、物語化手段23が、生成する物語を1文にするような物語の生成指示を物語生成手段51に送信し、統合化手段24が、1枚のイラスト及び1文の物語の統合を行っても良い。
【0069】
物語化手段23が物語生成手段51に送信する生成指示としては、ユーザから受け付けたテキストを1つずつ送信しても良い。例えば、図6のT62a、T62b、T62c、・・・を1つずつ送信することが考えられる。
【0070】
この他にも、物語化手段23がユーザから受け付けた2つ目のテキストを生成指示として物語生成手段51に送信する場合、ユーザから受け付けた2つ目のテキスト、1つ目のテキスト、1つ目のテキストから物語生成手段51が生成した物語を送信しても良い。例えば、図6のT62bを送信する場合、T62b、T62a、T62aから物語生成手段51が生成した回答を送信する。つまり、N個目のテキストを生成指示として送信する場合、物語化手段23は、N及びN-1個目のテキスト及びN-1個目のテキストの回答を物語生成手段51送信する。また、3つ目のテキストを生成指示として送信する場合、1~3つ目のテキスト、1つ目及び2つ目のテキストから物語生成手段51が生成した物語を送信しても良い。つまり、N個目のテキストを生成指示として送信する場合、物語化手段23は、1~N個目のテキスト、1~N-1個目のテキストから物語生成手段51が生成した物語を物語生成手段51に送信する。物語化手段23は、ユーザから受け付けた過去のテキスト及び物語生成手段51からの回答を全て物語生成手段51に送信しても良いし、テキスト又は回答のどちらか全てを送信しても良い。
【0071】
受け付けた1枚の写真P62a及び1つのテキストT62aは対応するため、P62aから生成されたイラスト及びT62aから生成された物語が、統合化手段24によって統合され、絵本の1ページとして生成される。統合化手段24は、生成した絵本の1ページを、任意の順番に統合して絵本データを生成しても良い。例えば、絵本生成装置2は、ユーザの写真及びテキストの入力順のページ順の絵本データを生成する。図6では、ユーザが場面01、場面02、の順番で入力し、統合化手段24が、場面01、場面02、・・・の順番の絵本データを生成する。イラスト化手段22及び物語化手段23が、場面01、場面02、・・・の順番に送信し、イラスト及び物語を受信した順番に統合する。この他に、送信する写真及びテキストに順番を表す情報を紐づけて送信し、順番を表す情報をもとに、受信したイラスト及び物語を統合しても良い。ユーザは、自身の好きな順番で場面設定写真及びテキストを入力又はそれぞれの場面に順番を表す情報を入力することによって、自身の好きな順番の絵本を生成することができる。
【0072】
この他にも、場面設定において、受付手段21は、複数の写真に対して、1つ又は複数のテキストを受け付けても良い。イラスト化手段22は、複数の写真を用いてイラストの生成指示をイラスト生成手段41に送信し、物語化手段23は、1つ又は複数のテキストを用いて物語の生成指示を物語生成手段51に送信する。統合化手段24は、物語生成手段51が生成した物語を分割して、イラスト生成手段41が生成したイラストとの統合を行い、絵本データを生成する。写真とテキストが1対1で対応していないため、統合化手段24が物語を分割して、イラストに対応させる。
【0073】
場面設定において、受付手段21が受け付けた場面設定写真に人が写っている場合、ユーザによる登場人物設定が行われず、絵本生成装置2は、場面設定写真に写っている人物を用いて絵本を作成しても良い。この場合、場面設定において、場面設定写真に写っている人の役割を設定しても良い。また、場面設定において、受付手段21が受け付けた場面設定写真に人が写っている場合、絵本生成装置2は、機械学習モデル等を利用した画像解析手法によって顔認識を行い、登場人物設定写真から場面設定写真に写っている人を検出し、検出した登場人物設定写真に紐づく登場人物設定写真情報を物語生成手段51に送信しても良い。
【0074】
ユーザは、W63のように、イラスト方向性設定を行う。ユーザは、ユーザ入力情報として、S63a、S63b、・・・のように、イラストの方向性を選択する。図6では、イラストの方向性として、S63aの「リアル」が選択されている。受付手段21が、図6のように、ユーザ入力情報として、「リアル」の入力を受け付けると、イラスト化手段22は、「リアル」に紐づく図3(c)のようなイラストの方向性の指示を用いてイラストの生成指示をイラスト生成手段41に送信する。
【0075】
ユーザは、W64のように、物語方向性設定を行う。ユーザは、ユーザ入力情報として、S64a、S64b、・・・のように、物語の方向性を選択する。図6では、物語の方向性として、S64bの「冒険」が選択されている。受付手段21が、図6のように、ユーザ入力情報として、「冒険」の入力を受け付けると、物語化手段23は、「冒険」に紐づく図3(d)のような物語の方向性の指示を用いてイラストの生成指示を物語生成手段51に送信する。
【0076】
ステップS502において、イラスト化手段22は、S501において受付手段21がユーザから受け付けたユーザ入力情報を、イラストの生成指示として、イラスト生成手段41に送信する。さらに、ステップS502において、物語化手段23は、S501において受付手段21がユーザから受け付けたユーザ入力情報を、物語の生成指示として、物語生成手段51に送信する。
【0077】
ステップS503において、イラスト生成手段41及び物語生成手段51は、S502においてそれぞれが生成したイラスト又は物語を、イラスト又は物語の生成指示の送信元に送信する。
【0078】
ステップS504において、統合化手段24は、S503において受信したイラスト及び物語の統合を行い、絵本データを生成する。
【0079】
ステップS505において、絵本生成装置2は、生成した絵本データをユーザ端末3に出力する。ユーザは、ユーザ端末3を介して、生成された絵本のイラスト及び物語を確認し、気に入らない場合、ユーザ入力情報を変更しても良い。
【0080】
絵本生成装置2は、少なくとも絵本データを含む製本指示を工場に送信する。工場は、受信した絵本データを用いて製本し、製本された絵本をユーザ基本情報が有するユーザの住所に送信しても良い。
【0081】
図7は、しつけ、マナー又はルールに関する絵本生成のためのユーザ入力情報の入力画面の一例を示す。なお、図6と同様の入力画面については、同様の符号を付してその説明を省略する。
【0082】
ユーザは、W72のように、絵本のテーマ設定を行う。テーマ設定では、図7のT72a、T72b、・・・のように、受付手段21は、しつけ、マナー又はルールに関する1つのテーマを受け付ける。また、しつけ、マナー又はルールに関する絵本を生成する場合、登場人物設定において、絵本に登場する人物を設定する必要がある。イラスト化手段22は、登場人物設定において受け付けた写真及びテーマ設定において受け付けたテーマに紐づくイラストの方向性の指示を用いてイラスト生成手段41に送信する。さらに、物語化手段23は、登場人物設定において受け付けた写真に紐づく登場人物設定写真情報及びテーマ設定において受け付けたテーマに紐づく物語の方向性の指示を用いて物語生成手段51に送信する。記憶部6が、図4(a)のように、テーマに紐づけてイラスト及び物語の方向性の指示を格納しているため、イラスト化手段22及び物語化手段23は、生成指示をイラスト生成手段41及び物語生成手段51に送信することができる。
【0083】
実施形態1では、イラストの生成指示をイラスト生成手段41に送信、物語の生成指示を物語生成手段51に送信したが、イラスト及び物語の生成指示を同一の生成手段に送信しても良い。この同一の生成手段は、ニューラルネットワーク等の機械学習モデルであっても、大規模言語モデルであっても良い。
【0084】
<実施形態2>
実施形態2では、イラスト及び物語の統合を統合装置7が行う形態を示す。なお、実施形態1と同様の構成については、同様の符号を付してその説明を省略する。図8は、実施形態2における絵本生成システム1のブロック図を示す。
【0085】
生成物送信手段25は、イラスト生成手段41が生成したイラスト及び物語生成手段51が生成した物語を用いて統合指示を統合手段71に送信する。場面設定において写真とテキストが1対1で対応している場合、統合指示は、写真とテキストの1対1の対応関係の情報を含む。統合手段71は、機械学習モデル又は大規模言語モデルであり、統合装置7のハードウェア構成等は、イラスト生成装置4又は物語生成装置5と同様のものである。
【0086】
統合装置7は、機能構成要素として、統合手段71を備える。統合手段71は、統合指示に含まれるイラスト及び物語を用いて絵本データを生成し、生成した絵本を、統合指示の送信元に送信する。本実施形態において、統合指示の送信元は、絵本生成装置2であるが、これに限定されず、ユーザ端末3とする態様を採用することもできる。
【0087】
実施形態2では、イラストの生成指示をイラスト生成手段41に送信、物語の生成指示を物語生成手段51に送信、イラスト及び物語の統合指示を統合手段71に送信したが、イラストの生成指示、物語の生成指示、イラスト及び物語の統合指示を同一の生成手段又は生成装置に送信しても良い。この同一の生成手段は、ニューラルネットワーク等の機械学習モデルであっても、大規模言語モデルであっても良い。また、同一の生成装置は、ニューラルネットワーク等の機械学習モデル又は大規模言語モデルである生成手段を有しても良い。
【0088】
イラスト生成装置4、物語生成装置5、統合装置7の一部又は全部を第三者が提供し、ウェブAPIを利用してイラスト及び物語の生成並びにイラスト及び物語の統合を行わせても良い。
【符号の説明】
【0089】
1 絵本生成システム
2 絵本生成装置
21 受付手段
22 イラスト化手段
23 物語化手段
24 統合化手段
25 生成物送信手段
3 ユーザ端末
4 イラスト生成装置
41 イラスト生成手段
5 物語生成装置
51 物語生成手段
6 記憶部
7 統合装置
71 統合手段
NW 通信ネットワーク
【要約】
【課題】
ユーザが撮影した写真及びユーザが入力した情報を用いて、イラスト及びイラストに適した物語を有する絵本を生成する技術を提供する。
【解決手段】
絵本の生成を行う絵本生成システムであって、
受付手段と、イラスト化手段と、物語化手段と、統合化手段と、を備え、
前記受付手段は、写真、テキスト、テーマの少なくとも1つを含むユーザ入力情報を受け付け、
前記イラスト化手段は、前記ユーザ入力情報を用いてイラストの生成指示をイラスト生成手段に送信し、
前記物語化手段は、前記ユーザ入力情報を用いて物語の生成指示を物語生成手段に送信し、
前記統合化手段は、前記イラスト生成手段が生成したイラスト及び前記物語生成手段が生成した物語の統合を行い、絵本データを生成する。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8