(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022179507
(43)【公開日】2022-12-02
(54)【発明の名称】ウェブコンテンツ自動生成システム
(51)【国際特許分類】
G06F 8/30 20180101AFI20221125BHJP
【FI】
G06F8/30
【審査請求】有
【請求項の数】2
【出願形態】OL
(21)【出願番号】P 2022145657
(22)【出願日】2022-09-13
(62)【分割の表示】P 2020525644の分割
【原出願日】2019-06-13
(31)【優先権主張番号】P 2018117710
(32)【優先日】2018-06-21
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】518221014
【氏名又は名称】株式会社Tsunagu.AI
(74)【代理人】
【識別番号】110002516
【氏名又は名称】特許業務法人白坂
(72)【発明者】
【氏名】森 隆晃
(57)【要約】
【課題】プログラミング言語を編集することなく簡単に作成することができるウェブコンテンツ自動生成システムを提供する。
【解決手段】ウェブコンテンツ自動生成システムは、ウェブコンテンツを一つの画像データとして取得する画像化データ取得部と、ウェブコンテンツを構成するHTMLデータを始めとしたソースコードを取得するソースコード取得部と、画像化データとソースコードとを解析することで教師データを取得する学習部と、作成しようとするウェブコンテンツを一つの画像データとして入力する画像データ登録部と、入力された画像データと、教師データ記憶部に記憶されている教師データとの関連度を解析する解析部と、解析部によって解析された関連度の高い教師データのソースコードに基づいて、入力された画像データに関するコンテンツソースコードを生成するコンテンツソースコード生成部とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
HTMLによって記述されたウェブコンテンツを自動で生成するウェブコンテンツ自動生成システムであって、
インターネット上に公開されているウェブサイトに掲載されているウェブコンテンツを一つの画像データとして取得する画像化データ取得部と、
当該ウェブコンテンツを構成するHTMLデータを始めとしたソースコードを取得するソースコード取得部と、
前記画像化データ取得部によって取得された画像化データと前記ソースコード取得部によって取得されたソースコードとを解析することで教師データを取得する学習部と、
作成しようとするウェブコンテンツを一つの画像データとして入力する画像データ登録部と、
入力された画像データと、前記学習部によって取得された教師データとの関連度を解析する解析部と、
前記解析部によって解析された関連度の高い教師データのソースコードに基づいて、入力された画像データに関するコンテンツソースコードを生成するコンテンツソースコード生成部と、
を備えたウェブコンテンツ自動生成システム。
【請求項2】
前記ウェブサイトを検索するウェブサイト検索部をさらに備え、前記ウェブサイト検索部は、入力された検索情報に基づいてクローラーが自動でインターネット上に公開されているウェブサイトを検索する、
請求項1に記載のウェブコンテンツ自動生成システム。
【請求項3】
インターネット上に公開されているウェブサイトに掲載されているウェブコンテンツを取得して、前記ウェブコンテンツを内容毎に、その内容を示すラベル付けを行うラベル付与部と、
ウェブコンテンツを生成するためのソースコードに基づいて、ウェブコンテンツの一部を構成する構成物を作成する作成部と、
前記ラベル付与部によってラベル付けが行われた内容に基づいて、及び、ソースコードと前記作成部によって作成され構成物とに基づいて、教師データを取得する学習部と、
ウェブコンテンツを作成するためのウェブデザインを取得するウェブデザイン取得部と、
前記ウェブデザイン取得部によって取得された前記ウェブデザインと、前記学習部によって取得された教師データとに基づいて前記ウェブデザインの内容を取得し、その内容に応じたソースコードを生成するコンテンツソースコード生成部と、
を備えたウェブコンテンツ自動生成システム。
【請求項4】
前記コンテンツソースコード生成部は、前記ウェブデザインの内容の一部と前記構成物とが対応する場合、教師データに基づいて、前記構成物に対応するソースコードを生成する
請求項3に記載のウェブコンテンツ自動生成システム。
【請求項5】
前記コンテンツソースコード生成部は、前記ウェブデザインにおける内容の位置に基づいて、前記ウェブデザインの内容のレイアウトに対応するように、ウェブコンテンツにおける内容を配置する位置に関する位置情報を生成する
請求項3又は4に記載のウェブコンテンツ自動生成システム。
【請求項6】
前記ウェブデザイン取得部は、前記ウェブデザインに画像が含まれる場合、その画像に対応する画像データを取得し、
前記コンテンツソースコード生成部は、前記ウェブデザイン内の画像の位置に基づいて、ウェブコンテンツ内に前記画像データに基づく画像を配置するための位置情報を生成する
請求項5に記載のウェブコンテンツ自動生成システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ウェブコンテンツ自動生成システムに関し、特に、インターネット上に公開するウェブページを自動で生成するためのシステムとして有用なものである。
【背景技術】
【0002】
近年、企業や事業主が自身の商品やサービスを販売するために、商品やサービスを紹介するウェブページを作成し、ウェブサイトとしてインターネット上で一般に公開する事例が急増している。需要者はインターネット上に公開された各社のウェブサイトを閲覧し、商品やサービス購入の参考とすることができる。
【0003】
このようなウェブサイトは、HTML(Hyper Text Markup Language,ハイパーテキストマークアップ言語)というマークアップ言語、ウェブページのスタイルを指定するための言語であるCSS(Cascading Style Sheet)、ウェブページに動き及び対話性を持たせることができるJS(Java Script(登録商標))といったプログラミング言語、及び、写真やイラスト等を表示するjpgやpng等のデータ形式による画像データに基づいて作成されている。ウェブサイトを作成および公開するにあたっては、コンテンツを作成するためのマークアップ言語及びプログラミング言語に関する知識、及び、作成したコンテンツをウェブサーバ上にアップロードするための、ウェブサーバに関する知識が必要となる。これは、一般的には、知識と経験を有するウェブ制作業者がこれらの作業を実施することとなる。
【0004】
ところで、このようなウェブサイトは世界中で十億もの数があると言われている。ウェブサイトは、一旦作成すれば、公開している情報が古くならない限り、そのまま公開を維持することができる。このため、公開されているウェブサイトの数は増加の一途をたどっている。
【0005】
そして、ウェブサイトが増加するにしたがい、事業者がウェブサイトを保有することの重要性が高まっている。今までウェブサイトを保有していなかった業者、又は、ウェブサイトとは縁遠いと思われていた業界が、次々とウェブサイトを作成し始めている。このため、ウェブサイト作成の需要が高まっており、ウェブ制作業者の求人倍率が高まり、人材不足のため供給量が追い付かなくなってきている。
【0006】
また、ウェブサイトの数の増加だけでなく、上記HTML、CSS、及び、JSといった言語のバージョンが上がっているため、ウェブサイトを作成するにあたって要求されるレベルが上がってきており、さらにウェブ制作業者の負担が増加する一因となっている。
【0007】
ウェブサイト作成の負担を軽減するための技術として、特許文献1に示すような、テンプレートを用いた手法がある(特許文献1)。特許文献1に記載の技術によると、ウェブサイトに掲載する文章や画像など、ウェブサイトを作成するにあたり必要な素材を準備し、それらの素材をテンプレートという予め決められた枠組みに当てはめることで、専門的なプログラミングの知識がなくても、容易にウェブサイトを作成することができる。
【先行技術文献】
【特許文献】
【0008】
【発明の概要】
【発明が解決しようとする課題】
【0009】
このような技術を利用することにより、ウェブサイトの作成を希望する者は、実際にプログラミング言語を操作することなくウェブサイトを作成することができるため、ウェブサイト作成の手間が大幅に省けるという効果を奏する。
【0010】
ところで、一般的なウェブサイトにおいては、複数の文章、画像及び/又は映像が複雑に配置されている。上述した特許文献1に記載される、テンプレートを利用したウェブサイトの作成方法を用いた場合、予め用意されたテンプレートにおける各パーツに、それぞれの文章、画像及び/又は映像を当てはめていくことに時間がかかり、作業の効率が悪いという問題が生じる。
【0011】
また、単にテンプレートに当てはめただけでは、ページ全体のバランスが悪くなり、当てはめた後で、文章や画像等の配置、一行当たりの文字数又は改行の位置などにおいて、微調整が必要となる場合がある。その場合、マークアップ言語及びプログラミング言語を編集することにより微調整を実施することになるため、さらに作業効率の悪化を招くことになる。
【0012】
しかも、予め用意されるテンプレートは、一般的に、複数の中からユーザが選択するものであるから、上記のような微調整は、選択するテンプレートの種類によって異なるものであり、ウェブサイトを作成する都度、必要となる作業である。そのため、作業効率のさらなる悪化は免れず、作業者の負担を軽減するウェブサイト作成システムの実現が望まれる。
【0013】
本発明は、このような要望に鑑みてなされたものであり、複雑な構造を有するウェブサイトであっても、プログラミング言語を編集することなく簡単に作成することができるウェブコンテンツ自動生成システムを提供することを目的とする。
【課題を解決するための手段】
【0014】
一態様のウェブコンテンツ自動生成システムは、HTMLによって記述されたウェブコンテンツを自動で生成するウェブコンテンツ自動生成システムであって、インターネット上に公開されているウェブサイトに掲載されているウェブコンテンツを一つの画像データとして取得する画像化データ取得部と、当該ウェブコンテンツを構成するHTMLデータを始めとしたソースコードを取得するソースコード取得部、画像化データ取得部によって取得された画像化データとソースコード取得部によって取得されたソースコードとを解析することで教師データを取得する学習部と、作成しようとするウェブコンテンツを一つの画像データとして入力する画像データ登録部と、入力された画像データと、学習部によって取得された教師データとの関連度を解析する解析部と、解析部によって解析された関連度の高い教師データのHTMLデータに基づいて、入力された画像データに関するコンテンツソースコードを生成するコンテンツソースコード生成部とを備える。
【0015】
一態様のウェブコンテンツ自動生成システムによれば、複雑な構造を有するウェブサイトであっても、プログラミング言語を編集することなく簡単に作成することが可能となる。
【0016】
一態様のウェブコンテンツ自動生成システムは、ウェブサイトを検索するウェブサイト検索部をさらに備え、前記ウェブサイト検索部は、入力された検索情報に基づいてクローラーが自動でインターネット上に公開されているウェブサイトを検索することとしてもよい。
【0017】
一態様のウェブコンテンツ自動生成システムによれば、ウェブサイトを自動で検索し、検索したウェブサイトに関する教師データを収集するクローラーを設けていることにより、ウェブサイトの作成だけでなく、教師データの収集も自動化することが可能である。
【0018】
一態様のウェブコンテンツ自動生成システムは、インターネット上に公開されているウェブサイトに掲載されているウェブコンテンツを取得して、ウェブコンテンツを内容毎にラベル付けするラベル付与部と、ウェブコンテンツを生成するためのソースコードに基づいて、ウェブコンテンツの一部を構成する構成物を作成する作成部と、ラベル付与部によってラベル付けが行われた内容に基づいて、及び、ソースコードと作成部によって作成され構成物とに基づいて、教師データを取得する学習部と、ウェブコンテンツを作成するためのウェブデザインを取得するウェブデザイン取得部と、ウェブデザイン取得部によって取得されたウェブデザインと、学習部によって取得された教師データとに基づいてウェブデザインの内容を取得し、その内容に応じたソースコードを生成するコンテンツソースコード生成部と、を備える。
【0019】
一態様のウェブコンテンツ自動生成システムでは、コンテンツソースコード生成部は、ウェブデザインの内容に構成物に対応するものがある場合、教師データに基づいて、その構成物に対応するソースコードを生成することとしてもよい。
【0020】
一態様のウェブコンテンツ自動生成システムでは、コンテンツソースコード生成部は、ウェブデザイン内の内容が記載される位置に基づいて、ウェブコンテンツに内容を配置するための位置情報を生成することとしてもよい。
【0021】
一態様のウェブコンテンツ自動生成システムでは、ウェブデザイン取得部は、ウェブデザインに画像が含まれる場合、その画像に対応する画像データを取得し、コンテンツソースコード生成部は、ウェブデザイン内の画像の位置に基づいて、ウェブコンテンツ内に画像データに基づく画像を配置するための位置情報を生成することとしてもよい。
【0022】
一態様のウェブコンテンツ自動生成システムは、インターネット上に公開されているウェブサイトに掲載されているウェブコンテンツを取得して、ウェブコンテンツを内容毎に、その内容を示すラベル付けを行うラベル付与部と、ウェブコンテンツを生成するためのソースコードに基づいて、ウェブコンテンツの一部を構成する構成物を作成する作成部と、ラベル付与部によってラベル付けが行われた内容に基づいて、及び、ソースコードと作成部によって作成され構成物とに基づいて、教師データを取得する学習部と、ウェブコンテンツを作成するためのウェブデザインを取得するウェブデザイン取得部と、ウェブデザイン取得部によって取得されたウェブデザインと、学習部によって取得された教師データとに基づいてウェブデザインの内容を取得し、その内容に応じたソースコードを生成するコンテンツソースコード生成部と、を備える。
【0023】
一態様のウェブコンテンツ自動システムでは、コンテンツソースコード生成部は、ウェブデザインの内容の一部と構成物とが対応する場合、教師データに基づいて、構成物に対応するソースコードを生成することとしてもよい。
【0024】
一態様のウェブコンテンツ自動生成システムでは、コンテンツソースコード生成部は、ウェブデザインにおける内容の位置に基づいて、ウェブデザインの内容のレイアウトに対応するように、ウェブコンテンツにおける内容を配置する位置に関する位置情報を生成することとしてもよい。
【0025】
一態様のウェブコンテンツ自動生成システムでは、ウェブデザイン取得部は、ウェブデザインに画像が含まれる場合、その画像に対応する画像データを取得し、コンテンツソースコード生成部は、ウェブデザイン内の画像の位置に基づいて、ウェブコンテンツ内に画像データに基づく画像を配置するための位置情報を生成することとしてもよい。
【発明の効果】
【0026】
ウェブコンテンツ自動生成システムによれば、複雑な構造を有するウェブサイトであっても、マークアップ言語及びプログラミング言語を編集することなく簡単に作成することができる。
【図面の簡単な説明】
【0027】
【
図1】
図1は、第1実施形態におけるウェブコンテンツ自動生成システム1のハードウェア構成とソフトウェア機能を示すブロック図である。
【
図2】
図2は、ウェブコンテンツ自動生成の事前準備を示すフローチャートである。
【
図3】
図3は、ウェブページデータベース310の一例を示す図である。
【
図4】
図4は、ウェブページを画像化した画像化データ1000の一例を示す図である。
【
図5】
図5は、ウェブページを記述するソースコードであるHTMLデータ2000の一例を示す図である。
【
図6】
図6は、ウェブコンテンツの作成方法を示すフローチャートである。
【
図7】
図7は、第2実施形態に係るウェブコンテンツ自動生成システムについて説明するためのブロック図である。
【
図8】
図8は、第2実施形態に係り、教師データを作成する場合の処理の流れについて説明するフローチャートである。
【
図9】
図9は、第2実施形態に係り、ウェブコンテンツを自動で生成する場合の処理の流れを説明するフローチャートである。
【
図10】
図10は、変形例に係るウェブコンテンツ自動生成システムについて説明するためのブロック図である。
【発明を実施するための形態】
【0028】
以下、本発明を実施するための形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
【0029】
[第1実施形態]
まず、第1実施形態について説明する。
【0030】
[ウェブコンテンツ自動生成システム1の構成]
図1は、第1実施形態におけるウェブコンテンツ自動生成システム1のハードウェア構成とソフトウェア機能を説明するためのブロック図である。
【0031】
ウェブコンテンツ自動生成システム1は、データを制御する制御部100と、ユーザや他の機器と通信を行う通信部200と、データを記憶する記憶部300と、ユーザからの情報の入力を受け付ける入力部400と、制御部100で制御したデータや画像を出力する表示部500とを備える。
【0032】
制御部100は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、GPU(Graphic Proessing Unit)等を備える。
【0033】
通信部200は、他の機器と通信可能にするためのデバイス、例えば、IEEE802.11に準拠したWi-Fi(Wireless FIDelity)対応デバイス及びTCP/IPプロトコルを利用できるハードウェアを搭載しているデバイスを備える。
【0034】
制御部100は、所定のプログラムを読み込み、必要に応じて通信部200及び記憶部300と協働することで、検索情報登録モジュール111と、ウェブサイト検索モジュール112と、ウェブページ表示モジュール113と、画像化データ取得モジュール114と、HTMLデータ取得モジュール(ソースコード取得モジュール)115と、学習モジュール116と、教師データ記憶モジュール117と、画像データ登録モジュール118と、画像解析モジュール119と、コンテンツソースコード生成モジュール120とを実現する。
【0035】
記憶部300は、データやファイルを記憶する装置であって、ハードディスクや半導体メモリ、記録媒体、メモリカード等による、データのストレージ部を備える。記憶部300は、後に説明するウェブページデータベース310、教師データデータベース320及びウェブコンテンツデータベース330を記憶する。
【0036】
入力部400の種類は、特に限定されない。入力部400として、例えば、キーボード、マウス、タッチパネル等が挙げられる。
【0037】
表示部500の種類は、特に限定されない。表示部500として、例えば、モニタ、タッチパネル等が挙げられる。
【0038】
[ウェブコンテンツ自動生成システム1を用いた事前準備]
本実施形態におけるウェブコンテンツ自動生成システム1を使用してウェブコンテンツ作成を実施するに先立って行う事前準備について説明する。
図2はウェブコンテンツ自動生成システム1を用いた事前準備のフローチャートである。また、
図3はウェブページデータベース310の一例を示す図である。
図4はウェブページを画像化した画像化データ1000の一例を示す図であり、
図5はウェブページを記述するソースコードの一つであるHTMLデータ2000の一例を示す図である。
図1~
図5を用いて、上述した各ハードウェアと、ソフトウェアモジュールが実行する処理について説明する。
【0039】
〔ステップS110~S190:ウェブページに関する情報の収集〕
最初に、ウェブコンテンツ作成を実施するための事前準備として、関連するウェブページに関する情報を収集する。ウェブコンテンツ自動生成システム1を利用してウェブコンテンツを作成しようとするユーザ(事業者を含む、以下同じ)は、使用するユーザ端末(事業者端末を含む、以下同じ)を用いて所定のフォーマットに、教師データとして収集したいウェブページが掲載されるウェブサイトを検索するための検索情報を入力し(ステップS110)、インターネットを介してウェブコンテンツ自動生成システム1にアクセスし、収集するウェブサイトを検索するための検索情報を送信する(ステップS120)。
【0040】
ここで入力する検索情報としては、例えば、キャリア女性向けファッションの通販サイトを作成しようとしている場合、関連するウェブサイトを検索するための「キャリア」「女性」「ファッション」「通販」のようなキーワードが挙げられる。なお、ステップS120において、インターネットを介してユーザ端末からウェブコンテンツ自動生成システム1へ検索情報を送信するようにしたが、ウェブコンテンツ自動生成システム1がユーザ端末と一体となっているものであっても構わない。
【0041】
ユーザ端末からの検索情報を受信すると、ウェブコンテンツ自動生成システム1の制御部100は、記憶部300と協働して検索情報登録モジュール111を実行し、ユーザの操作によって入力された当該検索情報を、
図3に示す記憶部300のウェブページデータベース310に登録する(ステップS130)。
【0042】
図3に示すウェブページデータベース310には、ステップS130で登録された、教師データとして収集しようとしているウェブページが掲載されるウェブサイトを検索するためのキーワードに該当する検索情報と、当該検索情報に紐づいて、後述する収集されたウェブページに割り当てられるURL(Uniform Resource Locator)、当該ウェブページを画像化した画像化データ、当該ウェブページに表示されている画像データ、当該ウェブページを記述するソースコードであるHTMLデータ、ウェブページのスタイルを指定するためCSSデータ、及び、ウェブページに動きや対話性を持たせるJSデータが記憶される。
【0043】
次に、ウェブコンテンツ自動生成システム1の制御部100は、通信部200と協働してウェブサイト検索モジュール112を実行し、インターネットにアクセスし、ウェブページデータベース310に登録されたキーワードに基づいて、キーワードに該当するウェブサイトの検索を実行する(ステップS140)。
【0044】
ステップS140で検索結果のリストが得られると、ウェブコンテンツ自動生成システム1の制御部100は、表示部500と協働してウェブページ表示モジュール113を実行し、ステップS140における検索でヒットしたウェブサイトをブラウザ上で閲覧する(ステップS150)。
【0045】
そして、ウェブコンテンツ自動生成システム1の制御部100は、画像化データ取得モジュール114を実行し、ウェブサイトに掲載されるウェブページとして表示される画面を画像化データ1000として取得し(ステップS160)、さらに、記憶部300と協働して、取得された画像化データ1000を、ウェブページのURLと紐づけて前記ウェブページデータベース310に記憶する(ステップS170)。
【0046】
ウェブページとして表示される画面を画像化するにあたっては、ブラウザに表示される画面を端から端まで走査し、場合によってはこれらをつなぎ合わせることで、一つの画像化データ1000を得ることができる。得られた画像化データ1000は、例えば
図4に示すようになる。
【0047】
図4においては、商品に関する画像やキャンペーンを表示する画像が配置されており、それぞれの画像について、キャプションとなる文章が付されている。ステップS160においては、このようなテキストや画像すべてを一つの画像データとして取得する。
【0048】
併せて、ウェブコンテンツ自動生成システム1の制御部100は、ソースコード取得モジュール115を実行し、閲覧したウェブサイトのHTMLデータ2000、CSSデータ、及び、JSデータからなるソースコードをテキストデータとして取得し(ステップS180)、さらに、記憶部300と協働して、取得されたソースコードを、ウェブページのURLと紐づけて前記ウェブページデータベース310に記憶する(ステップS190)。
【0049】
ソースコードは、ブラウザ上で取得することが可能であり、得られたソースコードのうち、HTMLデータ2000は、例えば
図5に示すようになる。
【0050】
このようなウェブページデータベース310への画像化データ1000及びソースコードの保存を、ステップS140でヒットしたウェブサイトについて繰り返し実行することで、ウェブページデータベース310を構築する。
【0051】
なお、ステップS140のウェブサイトの検索からステップS190のソースコードの収集のステップは、クローラーと呼ばれるソフトウェアが自動でウェブサイトを検索し、ウェブページの閲覧を繰り返すことにより、複数の画像化データ1000とソースコードを自動で収集するようになっている。
【0052】
一方で、データを収集するためのウェブサイトのリストを、ウェブサイト検索モジュール112を用いて自動で検索するのではなく、ユーザ又は事業者が提供するようにしても構わない。
【0053】
〔ステップS200~S210:画像化データとソースコードとを紐づけて学習〕
ウェブページデータベース310の構築が終わると、ウェブコンテンツ自動生成システム1の制御部100は、学習モジュール116を実行し、ステップS130で記憶された検索情報、ステップS170で記憶された画像化データ1000、及び、ステップS190で記憶されたソースコードに基づいて学習を行い、教師データ3000を生成する(ステップS200)。この学習は、例えば、畳み込みニューラルネットワーク(Conclutional Nueral Network,CNN)などの機械学習モデルを使用し、画像や文章の内容及び配置に関する情報とソースコードとを関連付けることによりおこなう。なお、ステップS200における学習は、ステップS140における検索でヒットしたすべてのウェブページに関する情報を収集し終わってから行ってもよいし、一つのウェブページに関する情報を収集し、その都度、学習を行うようにしてもよい。
【0054】
そして、ウェブコンテンツ自動生成システム1の制御部100は、記憶部300と協働して教師データ記憶モジュール117を実行し、ステップS200における学習で生成された教師データ3000を教師データデータベース320に記憶する(S210)。
【0055】
このように、関連する複数のウェブサイトに関する画像化データ1000とソースコードとを関連付けて学習し、教師データ3000として記憶することにより、どのような画像化データであればどのようなソースコードが出力されるかについて学習することができる。
【0056】
教師データデータベース320への教師データ3000の記憶が終わると、ウェブコンテンツ自動生成のための事前準備を終了する。
【0057】
[ウェブコンテンツ自動生成システム1を用いたウェブコンテンツの作成]
次に、本実施形態におけるウェブコンテンツ自動生成システム1を使用したウェブコンテンツの作成について説明する。
図6は、ウェブコンテンツ自動生成システム1を用いたウェブコンテンツの作成方法を示すフローチャートである。
【0058】
ウェブコンテンツを作成するユーザは、まず、作成したいウェブコンテンツを表す画像データ4000を作成し(ステップS310)、作成した画像データ4000をウェブコンテンツ自動生成システム1に送信する(ステップS320)。
【0059】
ステップS310で作成される画像データ4000は、文書作成ソフトなどを使用して、又は手書きで、画像や文章を配置することによってまずワイヤーフレームとして作成され、その後、画像データに変換されたものなどが用いられる。
【0060】
ステップS320で画像データ4000を受信すると、ウェブコンテンツ自動生成システム1の制御部100は、記憶部300と協働して画像データ登録モジュール118を実行し、画像データ4000をウェブコンテンツデータベース330に登録する(ステップS330)。
【0061】
ステップS330で画像データ4000が登録されると、ウェブコンテンツ自動生成システム1の制御部100は、画像解析モジュール119を実行し、登録された画像を解析する(ステップS340)。
【0062】
ステップS340において画像を解析するにあたっては、登録された画像データ4000を走査し、画像や文章の内容及び配置に関しての情報を収集する。このときの画像データ4000の走査は、ステップS160における画像化データ1000の走査と同様の手法が用いられる。
【0063】
次に、ウェブコンテンツ自動生成システム1の制御部100は、記憶部300と協働してコンテンツソースコード生成モジュール120を実行し、ウェブコンテンツを生成するためのコンテンツソースコード5000を生成する(ステップS350)。ウェブコンテンツを生成するためのコンテンツソースコード5000には、HTMLデータやCSSデータ等のマークアップ言語によるデータ、及び、ウェブコンテンツに掲載される画像に関するデータが含まれる。また、必要に応じて、JSデータが含まれていてもよい。
【0064】
ステップS350においてコンテンツソースコード5000を生成するにあたって、画像データ4000の走査によって得られた情報と、教師データデータベース320に記憶されている複数の教師データ3000とを比較し、最も近い教師データ3000のソースコードを参照し、画像データ4000で表示される内容を記述するためのコンテンツソースコード5000を出力する。また、必要に応じて、画像の差し替えや、HTMLの構文チェックなどの後処理を行い、コンテンツソースコード5000の生成が完了する。
【0065】
ステップS350でコンテンツソースコード5000が生成されると、ウェブコンテンツ自動生成システム1の制御部100は、生成されたコンテンツソースコード5000をユーザ端末に提供され、コンテンツの自動生成を終了する。(ステップS360)。
【0066】
[変形例1]
本実施形態におけるウェブコンテンツ自動生成システムでは、ステップS350において、登録して解析された画像データ4000と最も近い教師データ3000に基づいてコンテンツソースコード5000が作成されたが、最も近い教師データ3000ではなく、類似する複数の教師データ3000に基づいて、複数のコンテンツソースコード5000を作成するようにしてもよい。この場合、複数のバリエーションのウェブコンテンツが生成されるため、ユーザの好みに応じて、最適なウェブコンテンツを生成することができる。
【0067】
以上のように構成することで、複雑な構造を有するウェブサイトであっても、プログラミング言語を編集することなく簡単に作成することができるウェブコンテンツ自動生成システムを提供することができる。
【0068】
以上、本発明の実施形態について説明したが、本発明は上述したこれらの実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
【0069】
[第2実施形態]
次に、第2実施形態について説明する。
図7は、第2実施形態に係るウェブコンテンツ自動生成システムについて説明するためのブロック図である。
【0070】
第2実施形態に係るウェブコンテンツ自動生成システム2は、ラベル付与部151、作成部153、学習部154、ウェブデザイン取得部155、コンテンツソースコード生成部156、通信部200、記憶部300、入力部400及び表示部500を備える。
ラベル付与部151、作成部153、学習部154、ウェブデザイン取得部155及びコンテンツソースコード生成部156は、制御部の一機能として構成される。このため、ラベル付与部151、作成部153、学習部154、ウェブデザイン取得部155及びコンテンツソースコード生成部156は、制御部を構成するラベル付与モジュール、作成モジュール、学習モジュール、ウェブデザイン取得モジュール及びコンテンツソースコード生成モジュールとして構成されてもよい。
【0071】
ラベル付与部151は、インターネット上に公開されているウェブサイトに掲載されているウェブコンテンツを取得して、ウェブコンテンツを内容毎に、その内容を示すラベル付けを行う。
ラベル付与部151は、複数のウェブコンテンツを取得して、それぞれのウェブコンテンツの内容毎にラベルを付与する。ラベル付与部151は、画像化データ取得部(画像化データ取得モジュール114(
図1参照))によって取得された画像化データが記憶部300に記憶されている場合、記憶部300から画像化データを取得して、画像化データの内容毎にラベルを付与してもよい。
【0072】
ラベルは、例えば、画像、テキスト及びボタン等の内容の分類を示す。ラベル付与部151は、例えば、ウェブコンテンツ(画像化データ)に画像、テキスト及びボタンが含まれている場合、画像に対しては画像ラベルを付与し、テキストに対してはテキストラベルを付与し、ボタンに対してはボタンラベルを付与する。
ラベル付与部151は、例えば、入力部400を用いたユーザの指示に基づいて、ウェブコンテンツの内容毎にラベルを付与することとしてもよい。
【0073】
作成部153は、ウェブコンテンツを生成するためのソースコードに基づいて、ウェブコンテンツの一部を構成する構成物を作成する。作成部153は、例えば、CSSコード等を用いて構成物を作成する。構成物は、ウェブコンテンツにおいて表示される表示情報(画像、文字、色、形など)を少なくとも含み、ユーザが指示を行うことが可能なものである。構成物は、例えば、ボタン等である。なお、構成物は、前述したボタンの他に、例えば、背景、背景の一部のエリア、及び、それらの装飾等であってよい。作成部153は、CSSコード等を変更することにより、形状、大きさ及び色彩等の変更した複数の構成物を作成する。
【0074】
学習部154は、ラベル付与部151によってラベル付けが行われた内容に基づいて、教師データを作成する。学習部154は、例えば、畳み込みニューラルネットワーク(CNN)等を利用して、内容の特徴量を把握し、教師データを作成する。すなわち、学習部154は、例えば、内容(画像)は画像であること、内容(テキスト)はテキストであること、及び、内容(ボタン)はボタンであること等の、ラベル付けが行われた内容が何であるかを学習する。
【0075】
また、学習部154は、ソースコードと、作成部153によって作成され構成物とに基づいて、教師データを作成する。学習部154は、例えば、LSTM(Long Short-Term Memory)等を利用して、作成部153によって作成されたCSSコードを学習する。また、学習部154は、例えば、CNN等を利用して、作成部153によって構成物を学習することとしてもよい。学習部154は、LSTM等によるCSSの学習結果と、CNN等による構成物の学習結果とを結合することにより、教師データを作成する。具体的な一例としては、学習部154は、CSSコードと構成物とを関連付けることにより、教師データを作成する。
【0076】
ウェブデザイン取得部155は、ウェブコンテンツを作成するためのウェブデザインを取得する。ウェブデザインは、第1実施形態で説明した画像データであってもよい。ウェブデザイン取得部155は、ウェブデザインに画像が含まれる場合、その画像のデータ(画像データ)を取得して、画像データを記憶部300に記憶する。
【0077】
コンテンツソースコード生成部156は、ウェブデザイン取得部155によって取得されたウェブデザインと、学習部154によって取得された教師データとに基づいてウェブデザインの内容を取得し、その内容に応じたソースコードを生成する。
まず、コンテンツソースコード生成部156は、教師データに基づいてウェブデザインを解析することにより、ウェブデザイン内の内容を検出して、ウェブデザインの内容毎にラベル付けを行う。ラベルは、ラベル付与部151によって付与されるラベルと同じものであってよく、例えば、画像、テキスト及びボタン等の分類である。
【0078】
コンテンツソースコード生成部156は、ウェブデザインに、テキストのラベルが付与された内容がある場合、その内容についてテキスト検出を行い、テキストデータを生成する。なお、コンテンツソースコード生成部156は、ウェブデザイン取得部155によって取得されたウェブデザインからテキスト検出を行うこととしてもよい。
【0079】
コンテンツソースコード生成部156は、ウェブデザインの内容の一部と、上述した構成物とが対応する場合、教師データに基づいて、その構成物に対応するソースコードを生成することとしてもよい。コンテンツソースコード生成部156は、ウェブデザインに、一例としてボタンのラベルが付与された構成物がある場合、教師データに基づいて、その構成物のソースコード(一例として、CSSコード)を生成する。
【0080】
上述したように、ウェブデザイン取得部155は、ウェブデザインに画像が含まれる場合、その画像に対応する画像データ(画像素材)を取得することとしてもよい。この場合、コンテンツソースコード生成部156は、ウェブデザイン内の画像の位置に基づいて、ウェブコンテンツ内に画像データに基づく画像を配置するための位置情報を生成することとしてもよい。コンテンツソースコード生成部156は、ウェブデザインに画像のラベルが付与された内容がある場合、そのラベルが付与された画像と、ウェブデザイン取得部155によって取得された画像データとを1対1に対応付ける。すなわち、コンテンツソースコード生成部156は、画像ラベルが付与された画像と、その画像に一致する画像データ(画像素材)とをマッチングさせる。
なお、コンテンツソースコード生成部156は、ウェブデザイン取得部155によって取得されたウェブデザインに含まれる画像と、画像データ(画像素材)とを1対1に対応付けることとしてもよい。この場合、コンテンツソースコード生成部156は、ウェブデザインに含まれる画像と、画像データとの類似度が高ければ、対応付けることが可能である。
【0081】
コンテンツソースコード生成部156は、ウェブデザインにおける内容の位置に基づいて、ウェブデザインの内容のレイアウトに対応するように、ウェブコンテンツにおける内容を配置する位置に関する位置情報を生成することとしてもよい。コンテンツソースコード生成部156は、ウェブデザインの内容を検出したときの検出情報と、テキスト検出、ボタンの生成及び画像マッチングの結果とに基づいて、ウェブコンテンツにテキスト、ボタン及び画像等を配置する位置に関する情報(位置情報)を生成する。その位置情報は、ウェブコンテンツ内に、例えば、テキスト、ボタン、及び、画像(画像データ)を配置するための情報である。位置情報は、例えば、ウェブデザインにおける座標系の座標から、ウェブコンテンツにおける座標系の座標を生成することとしてもよい。また、位置情報は、例えば、内容(テキスト、ボタン及び画像等)の中心位置の座標であってもよく、左上(又は、右上、左下、右下)の位置の座標であってもよい。
【0082】
すなわち、コンテンツソースコード生成部156は、ウェブデザイン内のテキストの位置に対応するように、生成するウェブコンテンツ内にテキスト(テキストデータ)を配置するための位置情報を生成する。また、コンテンツソースコード生成部156は、ウェブデザイン内のボタンの位置に対応するように、生成するウェブコンテンツ内にボタンを配置するための位置情報を生成する。さらに、コンテンツソースコード生成部156は、ウェブデザイン内の画像の位置に対応するように、生成するウェブコンテンツ内に画像(画像データ)を配置するための位置情報を生成する。
コンテンツソースコード生成部156は、ユーザによって入力部400が操作されることに基づいて、ラベル及び位置情報を修正することとしてもよい。すなわち、コンテンツソースコード生成部156は、テキスト、画像及びボタン等のラベル情報、及び、それらの位置情報を修正することとしてもよい。
【0083】
コンテンツソースコード生成部156は、テキスト、画像(画像データ)、ボタン等(構成物)のCSSコード、及び、それらの位置情報等を結合することにより、ウェブコンテンツのソースコードを生成する。コンテンツソースコード生成部156は、生成したソースコードに基づいてウェブコンテンツを表示部500に表示する。
【0084】
第2実施形態の通信部200、記憶部300、入力部400及び表示部500は、第1実施形態で説明した通信部200、記憶部300、入力部400及び表示部500と同様の構成であってよい。
【0085】
次に、第2実施形態に係るウェブコンテンツ自動生成方法について説明する。
まず、教師データを作成する場合の処理の流れを説明する。
図8は、第2実施形態に係り、教師データを作成する場合の処理の流れについて説明するフローチャートである。
【0086】
ステップST301において、ラベル付与部151は、インターネット上に公開されているウェブサイトに掲載されているウェブコンテンツを取得する。ラベル付与部151は、自動的に複数のウェブコンテンツを取得することとしてもよい。
【0087】
なお、ウェブコンテンツ自動生成システム2は、ラベル付与部151の代わりに、第1実施形態と同様に、次のようにウェブコンテンツを取得することとしてもよい。すなわち、ウェブサイト検索部(ウェブサイト検索モジュール112:
図1参照)は、通信部200を介してインターネットにアクセスしてウェブサイトを検索する。ウェブページ表示部(ウェブページ表示モジュール113:
図1参照)は、検索でヒットしたウェブサイトを、ブラウザを利用して表示部500に表示する。画像化データ取得部(画像化データ取得モジュール114:
図1参照)は、表示部500に表示されるウェブサイトのウェブコンテンツを画像化データとして取得する。
【0088】
ステップST302において、ラベル付与部151は、ステップST301で取得したウェブコンテンツ(画像化データ)を内容毎にラベル付けする。ラベル付与部151は、例えば、ウェブコンテンツ(画像化データ)に画像が含まれている場合、画像に対して画像ラベルを付与する。ラベル付与部151は、例えば、ウェブコンテンツ(画像化データ)にテキストが含まれている場合、テキストに対してテキストラベルを付与する。ラベル付与部151は、例えば、ウェブコンテンツ(画像化データ)にボタンが含まれている場合、ボタンに対してボタンラベルを付与する。
【0089】
ステップST303において、作成部153は、例えば、CSSコード等のソースコードに基づいて、ウェブコンテンツの一部を構成する構成物を作成する。構成物は、例えば、ボタン等である。作成部153は、形状、大きさ及び色彩等の変更した複数の構成物を作成する。
【0090】
ステップST304において、学習部154は、ステップST302でラベル付けが行われた内容に基づいて、教師データを作成する。例えば、学習部154は、ラベル付けが行われた内容の特徴量を把握することに基づいて、教師データを作成する。
また、学習部154は、ステップST304で用いられたソースコードと、生成された構成物とに基づいて、教師データを作成する。例えば、学習部154は、ソースコードと構成物とを関連付けることにより、教師データを作成する。
【0091】
次に、ウェブコンテンツを自動で生成する場合の処理の流れを説明する。
図9は、第2実施形態に係り、ウェブコンテンツを自動で生成する場合の処理の流れを説明するフローチャートである。
【0092】
ステップST401において、ウェブデザイン取得部155は、ウェブコンテンツを作成するためのウェブデザインを取得する。この場合、ウェブデザイン取得部155は、ウェブデザインに画像が含まれる場合、ユーザによってその画像のデータ(画像データ)がアップロードされると、画像データを記憶部300に記憶する。
【0093】
ステップST402において、コンテンツソースコード生成部156は、ステップST401で取得されたウェブデザインの内容毎にラベルを付与し、テキストを示すテキストラベルが付与された内容についてテキストを検出する。すなわち、コンテンツソースコード生成部156は、ステップST401で取得されたウェブデザインにテキストラベルが付与された内容がある場合、その内容について学習済みモデルを利用してテキスト検出を行い、テキストデータを生成する。なお、コンテンツソースコード生成部156は、ステップST401で取得されたウェブデザインからテキスト検出を行うこととしてもよい。
【0094】
ステップST403において、コンテンツソースコード生成部156は、ウェブデザインの内容に構成物に対応するものがある場合、ステップST305で生成された教師データに基づいて、その構成物に対応するソースコードを生成する。すなわち、コンテンツソースコード生成部156は、ウェブコンテンツに、一例としてボタンのラベルが付与された構成物がある場合、教師データに基づいて、構成物のソースコード(一例として、CSSコード)を生成する。
【0095】
ステップST404において、コンテンツソースコード生成部156は、ウェブデザインに画像のラベルが付与された内容がある場合、そのラベルが付与された画像と、ステップST401で取得された画像データとを1対1に対応付ける。すなわち、コンテンツソースコード生成部156は、画像ラベルが付与された画像と、その画像に一致する画像データとをマッチングさせる。なお、コンテンツソースコード生成部156は、ステップST401で取得されたウェブデザインに含まれる画像と、画像データとを1対1に対応付けることとしてもよい。
【0096】
ステップST405において、コンテンツソースコード生成部156は、ステップST401で取得されたウェブデザインに内容が記載される位置に基づいて、ウェブコンテンツに内容を配置するための位置情報を生成する。コンテンツソースコード生成部156は、ウェブデザインの内容を検出したときの検出情報と、テキスト検出、構成物(ボタン)の生成及び画像マッチングの結果とに基づいて、ウェブコンテンツにテキスト、構成物及び画像を配置する位置に関する情報(位置情報)を生成する。
【0097】
ステップST406において、コンテンツソースコード生成部156は、例えば、ユーザによって入力部400が操作されることに基づいて、ステップST405で作成された位置情報等(ラベル及び位置情報)を修正することとしてもよい。
【0098】
ステップST407において、コンテンツソースコード生成部156は、ステップST402で検出したテキスト、ステップST403で生成した構成物のソースコード、ステップST404でマッチングさせた画像(画像データ)、ステップST405で生成した位置情報、及び、ステップST406で行われた修正に基づいて、ステップST401で取得したウェブデザインに応じたソースコードを生成する。
【0099】
次に、第2実施形態の効果について説明する。
ウェブコンテンツ自動生成システム2は、ウェブコンテンツを取得して、ウェブコンテンツを内容毎にラベル付けするラベル付与部151と、ウェブコンテンツを生成するためのソースコードに基づいて、ウェブコンテンツの一部を構成する構成物を作成する作成部153と、ラベル付与部151によってラベル付けが行われた内容に基づいて、及び、ソースコードと作成部153によって作成され構成物とに基づいて、教師データを取得する学習部154と、ウェブデザインを取得するウェブデザイン取得部155と、ウェブデザイン取得部155によって取得されたウェブデザインと、学習部154によって取得された教師データとに基づいてウェブデザインの内容を取得し、その内容に応じたソースコードを生成するコンテンツソースコード生成部156と、を備える。
これにより、ウェブコンテンツ自動生成システム2によれば、予め教師データを学習しておくことにより、ウェブデザインを入力すると自動でソースコードを生成することができる。よって、ウェブコンテンツ自動生成システム2は、ユーザが所望するウェブコンテンツを生成することができる。
【0100】
ウェブコンテンツ自動生成システム2では、コンテンツソースコード生成部156は、ウェブデザインの内容の一部と構成物とが対応する場合、教師データに基づいて、その構成物に対応するソースコードを生成することとしてもよい。
これにより、ウェブコンテンツ自動生成システム2は、ユーザが所望するウェブコンテンツにボタン等の構成物が有る場合でも、その構成物を含むウェブコンテンツを生成することができる。
【0101】
ウェブコンテンツ自動生成システム2では、コンテンツソースコード生成部156は、ウェブデザインにおける内容の位置に基づいて、ウェブデザインの内容のレイアウトに対応するように、ウェブコンテンツにおける内容を配置する位置に関する位置情報を生成することとしてもよい。
これにより、ウェブコンテンツ自動生成システム2は、ウェブデザインに応じたウェブコンテンツを生成することができる。
【0102】
ウェブコンテンツ自動生成システム2では、ウェブデザイン取得部155は、ウェブデザインに画像が含まれる場合、その画像に対応する画像データを取得することとしてもよい。この場合、コンテンツソースコード生成部156は、ウェブデザイン内の画像の位置に基づいて、ウェブコンテンツ内に画像データに基づく画像を配置するための位置情報を生成することとしてもよい。
これにより、ウェブコンテンツ自動生成システム2は、ウェブデザインに画像が含まれる場合でも、ウェブデザインに応じた画像を含むウェブコンテンツを生成することができる。
【0103】
上述したウェブコンテンツ自動生成システム2の各部は、コンピュータの演算処理装置等の機能として実現されてもよい。すなわち、ウェブコンテンツ自動生成システム2のラベル付与部151、作成部153、学習部154、ウェブデザイン取得部155及びコンテンツソースコード生成部156は、コンピュータの演算処理装置等による、ラベル付与機能、作成機能、学習機能、ウェブデザイン取得機能及びコンテンツソースコード生成機能としてそれぞれ実現されてもよい。
ウェブコンテンツ自動生成プログラムは、上述した各機能をコンピュータに実現させることができる。ウェブコンテンツ自動生成プログラムは、外部メモリ又は光ディスク等の、コンピュータで読み取り可能な非一時的な記録媒体に記録されていてもよい。
また、上述したように、ウェブコンテンツ自動生成システム2の各部は、コンピュータの演算処理装置等で実現されもよい。その演算処理装置等は、例えば、集積回路等によって構成される。このため、ウェブコンテンツ自動生成システム2の各部は、演算処理装置等を構成する回路として実現されてもよい。すなわち、ウェブコンテンツ自動生成システム2のラベル付与部151、作成部153、学習部154、ウェブデザイン取得部155及びコンテンツソースコード生成部156は、
図10に示すように、コンピュータの演算処理装置等を構成する、ラベル付与回路151a、作成回路153a、学習回路154a、ウェブデザイン取得回路155a及びコンテンツソースコード生成回路156aとして実現されてもよい。
また、ウェブコンテンツ自動生成システム2の通信部200、記憶部300、入力部400及び表示部500は、例えば、集積回路等によって構成されることにより、通信回路200a、記憶回路300a、入力回路400a及び表示回路500a(
図10参照)として実現されてもよい。また、ウェブコンテンツ自動生成システム2の通信部200、記憶部300、入力部400及び表示部500は、例えば、複数のデバイスによって構成されることにより、通信装置、記憶装置、入力装置及び表示装置として構成されてもよい。
【符号の説明】
【0104】
1,2 ウェブコンテンツ自動生成システム
100 制御部
112 ウェブサイト検索モジュール
114 画像化データ取得モジュール
115 ソースコード取得モジュール
116 学習モジュール
119 画像解析モジュール
120 コンテンツソースコード生成モジュール
151 ラベル付与部
153 作成部
154 学習部
155 ウェブデザイン取得部
156 コンテンツソースコード生成部
200 通信部
300 記憶部
310 ウェブページデータベース
330 ウェブコンテンツデータベース
【手続補正書】
【提出日】2022-09-14
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ウェブページデータベースと、
入力された検索情報に基づいて、インターネット上に公開されるウェブサイトを検索するウェブサイト検索部と、
前記ウェブサイト検索部によって検索された複数のウェブサイトそれぞれが表示される画面を端から端まで走査してつなぎ合わせることより、ウェブサイトに掲載されるウェブコンテンツを一つの画像化データとして取得して前記ウェブページデータベースに記憶する画像化データ取得部と、
当該ウェブコンテンツを構成するデータのソースコードを取得して前記ウェブページデータベースに記憶するソースコード取得部と、
前記ウェブページデータベースに記憶された、画像化データに記録される画像及び文章の内容及び配置に関する情報と、前記画像化データに応じたソースコードとを関連付けた学習であって、どのような画像化データであればどのようなソースコードが出力されるかについて学習を行うことにより学習済モデルを生成する学習部と、
作成しようとするウェブコンテンツを一つの画像データとして入力する画像データ登録部と、
入力された画像データと、前記学習部によって生成された学習済モデルとに基づいて、入力された画像データに応じたコンテンツソースコードを生成するコンテンツソースコード生成部と、
を備えるウェブコンテンツ自動生成システム。
【請求項2】
記憶部と、
ウェブサイトに掲載される複数のウェブコンテンツを取得し、当該ウェブコンテンツにおける画像、テキスト、及び、ボタンを含む構成物に関する内容と、当該内容を画像、テキスト、及び、ボタンを含む構成物に分類するラベルと、ウェブコンテンツの一部を構成する、画像、文字、色及び形を含む表示情報を少なくとも含み、ボタン、背景、当該背景の一部のエリア、及び、装飾を含むさらに含む構成物と、当該構成物のCSSコードを含むソースコードとを学習し、ラベル付けが行われた前記内容が何であるかを学習する学習済モデルを生成する学習部と、
ウェブコンテンツを作成するためのウェブデザインを取得すると共に、当該ウェブデザインに含まれる画像のデータを取得して前記記憶部に記憶するウェブデザイン取得部と、
前記ウェブデザイン取得部によって取得された前記ウェブデザインと、前記学習部によって生成された学習済モデルとに基づいて、前記ウェブデザインの内容毎にラベル付けを行い、ラベル付けを行った内容がテキストであればウェブデザインからテキストデータを生成し、ラベル付けを行った内容が構成物であればソースコードを生成し、ラベル付けを行った内容が画像であれば、ラベルが付与された画像とウェブデザイン内の画像データとの類似度が高い場合に対応付けて、ウェブデザインにおける内容の座標系の座標に基づいて対応するレイアウトにおける座標系の座標に関する位置情報であって入力操作に基づいて修正可能な当該位置情報を生成して、結合することにより前記ウェブコンテンツのソースコードを生成するコンテンツソースコード生成部と、を備え、
前記コンテンツソースコード生成部は、入力操作に基づいて、ラベル付けを行った、テキスト、構成物及び画像のラベル及び位置情報を修正可能である
ウェブコンテンツ自動生成システム。