キュレーションサービスのテキスト調査について
弊社キュレーションサービスに関する一連の事態につきまして、深くお詫び申し上げます。
テキスト調査について、メールのみではご説明が十分でない場合があるため、ご紹介ページを設置いたしました。
ご相談者様から特に多くいただくご質問や調査の方法についてご紹介させていただきます。
そのほか、ご不明な点などがございましたらご相談フォームよりお寄せいただければ幸いです。
調査の手順
1. ご相談者様のサイトのテキスト情報を抽出
ご相談者様からご提示いただいたURL(で指定されるページ)にアクセスし、ページのテキスト情報を抽出します。
2. 文字一致率を調べます
ご相談者様のテキストと、弊社記事のテキストの一致率を計算し、一致率が高いと判断された文を抽出します。
3. 調査結果を報告書にまとめ、ご報告します
特に一致率が高いと判定されたものについて、ご相談者様に報告書として提出します。
本テキスト調査でお調べできること、難しいこと
テキスト調査でできること
お申し出いただいたコンテンツ(URLで指定されるもの)のテキストと、弊社コンテンツのテキストとの文字の一致率*1
ご相談者様よりご連絡いただいたURLをもとに、弊社コンテンツとの文字の一致率を調べます。
*1:文章を一定の長さで区切り、単語の類似性判定を経たうえで文字の一致率判定をおこないます。
機械的に抽出しているため、調査結果にはノイズが含まれることがあります
テキスト調査ではお調べするのが難しいこと
短文のテキスト調査
「明日はお休みさせていただきます」「今日はとても気持ちの良い天気ですね」など、一般的な言葉の一致率が検出されてしまうのを避けるため、20文字以上の文字列についてのみ調査対象としています。
調査にあたりご理解とご協力をお願いいたします
テキストの調査にはお時間をいただきます
ご相談者様のページ20ページに対して、調査対象とする弊社の記事が1000記事だった場合、調査にはだいたい2~3週間を要します。
調査が必要な記事が多くて長くお待たせしてしまう場合には、途中報告を送らせていただきます。ご相談者様と運営者が異なる場合には、運営者の許諾が必要です
サイトの会員規約などで制限されていることがあるため、ご相談者様と運営者が異なる場合には、別途運営者より許諾を得たうえで調査を実施します。
運営者への許諾確認は弊社よりおこないますが、運営者の許可が得られないなど、調査を進められない場合があります。
許諾を得られなかったときには、調査を進める方法についてあらためてご相談させてください。