banner
ニュース センター
当社の製品はシンプル、便利、そして安全に使用できます。

クアンタマガジン

Apr 28, 2023

2023 年 5 月 18 日

カルロス・アロホ、Quanta Magazineに寄稿

寄稿者

2023 年 5 月 18 日

2010 年 6 月 27 日、FBI はニューヨーク市近郊に居住し、アメリカ人専門家として働いていた 10 人のロシア人スパイを逮捕した。 この事件は、偽りの身分と秘密会議の複雑なシステムを解明し、冷戦終結以来米国最大のスパイネットワークの一つを暴露し、番組『ジ・アメリカンズ』のインスピレーションとなった。

また、秘密メッセージを別のメッセージ内に隠す方法であるステガノグラフィーにも注目が集まりました。 ニューヨークのスパイたちは、公開ウェブサイトに投稿された一見無害な画像のピクセル内で通信を暗号化し、目に見えるところに秘密を隠した。 それらを読むために、受信者は画像をダウンロードし、それをバイナリコードの 1 と 0 に変換し、順番に取得されたどの変更された数字が秘密を説明するかを知る必要がありました。

ステガノグラフィーは芸術であり科学でもあり、暗号として知られるよく知られた秘密通信の方法とは異なります。 暗号化がメッセージの内容を意図的に隠し、メッセージを複雑なテキストや数字に変換するのに対し、ステガノグラフィーは秘密が存在するという事実を隠します。 「ステガノグラフィーはメッセージの存在を隠します」とベルン大学のコンピューター科学者で暗号学者のクリスチャン・カチン氏は言う。 「敵対者が隠されたメッセージを検出できた場合、送信者はゲームに負けます。」

秘密通信の他の方法と同様に、課題はそれを完全に安全にする方法です。つまり、人間も機械検出器も秘密が隠されたメッセージを疑うことはありません。 ステガノグラフィーの場合、これは長い間理論的には可能でしたが、実際の人間のコミュニケーションでは実現不可能だと考えられていました。

ChatGPT のような大規模な言語モデルの出現は、別の進むべき道を示唆しています。 人間が作成したテキストのセキュリティを保証することは不可能かもしれませんが、テキスト、画像、ビデオ、その他のメディアを問わず、機械生成メッセージのステガノグラフィーに対して完全なセキュリティを達成する方法が新しい証明によって初めて明らかにされました。 作者らは、安全なメッセージを生成するためのアルゴリズムのセットも含めており、それらを人気のあるアプリと組み合わせる方法に取り組んでいます。

「AIモデルとのインターフェースが非常に一般的な社会になるにつれて、人々が常に使用するメディアに機密情報をエンコードする機会がますます多くなっている」と、カーネギーメロン大学のコンピュータ科学者で開発に貢献したサミュエル・ソコタ氏は述べた。新しいアルゴリズム。

Quanta Magazine を受信箱に届けてください

Christian Cachin は、完全に安全なステガノグラフィー (無害なメッセージの中に秘密のメッセージを隠す手法) のルールを確立しましたが、人間が生成したテキストにはそれが不可能であることを発見しました。

エイドリアン・モーザー/ベルン大学

その結果は情報理論の世界から来ており、あらゆる種類のコミュニケーションを理解するための数学的枠組みを提供します。 これは、実用的なステガノグラフィーの複雑で乱雑な状態とは対照的に、抽象的で整然とした分野です。 ビンガムトン大学の研究者で、デジタルメディア内のデータを隠す(そして検出する)方法を研究しているジェシカ・フリドリッヒ氏は、世界が重なることはあまりない、と語る。 しかし、新しいアルゴリズムは、セキュリティに関する長年の理論的基準を満たし、機械生成コンテンツ内のメッセージを隠すための実用的なアプリケーションを提案することで、それらを統合します。 新しいアルゴリズムは、ニューヨークのロシア人のようなスパイによって悪用される可能性があるが、暗号化チャネルを禁止している国に出入りする情報を入手しようとする人々にも役立つ可能性がある。

ギリシャ語で「覆われた書き込み」を意味するステガノグラフィーのスキームは、デジタル メディアより数千年前から存在しています。

知られている最も古い例は、紀元前 5 世紀に書かれたヘロドトスの『歴史』に現れています。 ある物語では、メッセージが木の板に書かれ、途中で傍受されないようワックスの層で隠されています。 戦術家アエネアスのものとされる別のメッセージでは、特定の文字の上に目に見えないインクの点が隠されており、これが本当のメッセージを綴っています。 より極端な例では、暴君の指導者ヒスティアイウスは、甥に気づかれずに戦略を伝えたいと考え、奴隷の頭を剃り、その男の頭にメッセージを入れ墨し、髪の毛が生えるのを待ってから使者を送りました。 到着すると、甥は使者の頭を剃り、計画を明らかにします。

これらの戦略は継続されており、テクノロジーのおかげで新しい戦略が可能になりました。 第一次世界大戦中のドイツのスパイは、マイクロドットを介して情報を伝達する方法を発見しました。彼らは文書をコピーし、「i」のドットほど小さくなるまで縮小しました。これは一見無害に見えますが、拡大すると明らかになります。

政治家もまた、欺瞞的な芸術に目を向けるようになった。 1980年代、一連の報道漏洩の後、英国のマーガレット・サッチャー首相は閣僚のワードプロセッサを再プログラムし、各閣僚がほぼ検出不可能ではあるが独自の単語間隔パターンを持つようにしたと伝えられている。 このわずかな変更により、漏洩した文書の情報源を追跡できるようになりました。

このアプローチは、良くも悪くも 21 世紀でも繁栄し続けています。 現代のステガノグラフィー戦略には、目に見えないインクでメッセージを書くこと(ニューヨークのロシアのスパイが使用した別の戦術)、絵画の細部にアーティストの署名を隠すこと、隠しトラックまたは逆トラックを含むオーディオファイルのデザインが含まれます。 フリドリッヒ氏は、デジタルメディアにおけるステガノグラフィーのアプローチは、ボイスメールファイル内の画像を隠したり、ロシアのスパイの場合のように、加工された写真に書かれたテキストを配置したりするのにも役立つ可能性があると述べている。

カチン氏によると、数学者やコンピューター科学者がステガノグラフィーの正式な数学的ルールを模索し始めたのは 1980 年代になってからでした。 彼らは情報理論に目を向けました。この分野は、クロード シャノンの 1948 年の独創的な論文「コミュニケーションの数学理論」から始まり、チャネルを介した情報の送受信について考えるための分析的アプローチを確立しました。 (シャノンは電信線をモデル化しましたが、今日のデジタル技術の基礎を築きました。) 彼は変数内の情報量 (たとえば、手紙やメッセージをエンコードするのに必要なビット数) を定量化するために「エントロピー」という用語を使用しました。 1949 年に彼は、完全に安全な暗号化のためのルールを策定しました。 しかし、シャノン氏はステガノグラフィーにおけるセキュリティについては言及しなかった。

ほぼ50年後、カチンはそうしました。 彼のアプローチは、シャノンの精神に基づいて、言語を確率的に考えることでした。 アリスとボブという 2 人のエージェントについて考えてみましょう。彼らはステガノグラフィーを介してメッセージを伝え、敵であるイブには秘密にしたいと考えています。 アリスが無害なメッセージをボブに送信するとき、彼女は英語の辞書全体から単語を選択します。 これらの単語には確率が関連付けられています。 たとえば、「lexicon」という単語よりも「the」という単語が選択される可能性が高くなります。 全体として、単語は確率分布として表すことができます。 アリスがステガノグラフィーを使用してエンコードされたメッセージをボブに送信すると、そのメッセージには独自の確率分布が存在します。

情報理論家は、相対エントロピーと呼ばれる尺度を使用して確率分布を比較します。 これは、抽象的な種類の距離を測定するようなものです。2 つの分布間の相対エントロピーがゼロの場合、その秘密を解明するために「統計分析に頼ることはできません」と、オックスフォード大学のコンピュータ科学者で、新しい用紙。 言い換えれば、将来のスパイが秘密を密輸するための完全に安全なアルゴリズムを開発した場合、統計に基づいた監視はそれを検出できなくなるでしょう。 彼らの通信は完全に隠蔽されます。

しかし、カチン氏の証明は、カバーテキストとして知られる秘密を隠したメッセージに関する重要な仮定に依存していた。 元の無害なメッセージと区別できない新しいメッセージを思いつくには、カバーテキストの分布の完璧なシミュレーションを作成する必要がある、とカチン氏は述べた。 たとえば、書かれたメッセージの場合、それは人の言語を完全にシミュレートできるツールを使用することを意味します。 しかし、人間が作成したテキストはあまりにも乱雑です。 ChatGPT やその他の大規模な言語モデルは、説得力のあるシミュレーションを生成できますが、それに近づくことは可能ですが、正確ではありません。 「人間が作成したテキストの場合、これは実現不可能です」とカチン氏は言う。 そのため、完全に安全なステガノグラフィーは長い間手の届かないものだと思われてきました。

写真やテキストメッセージなどの人工デジタルメディアにメッセージを隠すという現実世界の複雑な仕組みに焦点を当てて研究を行っているフリドリッヒ氏は、完璧なシミュレーションは決して満たされない条件であると述べた。 「デジタル メディアの問題は、実際のモデルが存在しないことです」と彼女は言いました。 「複雑すぎます。ステガノグラフィーは決して完璧ではありません。」

しかし、機械が生成したテキストは、もちろん人間が作成したものではありません。 言語に焦点を当てた生成モデルや、画像や音声を生成する他の生成モデルの最近の台頭は、完全に安全なステガノグラフィーが現実世界でも可能である可能性を示唆しています。 結局のところ、これらのモデルは、多くの場合、いかにも人間らしいと思われるテキストを生成する一環として、明確に定義されたサンプリング メカニズムを使用しています。

ソコタ氏とシュローダー・デ・ウィット氏は以前、ステガノグラフィーではなく機械学習に取り組んでいた。 彼らは、さまざまなチャネルを通じて情報を送信する新しい方法を追求していましたが、ある時点で、最小エントロピー結合と呼ばれる情報理論の比較的新しい概念を知りました。

Samuel Sokota (左) と Christian Schroeder de Witt は、機械生成コンテンツを使用して完全に安全なステガノグラフィーを生成する方法の設計を支援しました。

サミュエル・ソコタ氏のご厚意による。 ジョン・ケアンズ

「この種の一見基本的なツールですが、あまり研究されていません」とソコタ氏は言う。 最小エントロピー結合では、研究者は 2 つの確率分布を、両方のシステムを表す単一の結合分布に結合できます。 ステガノグラフィーの場合、これらの分布の 1 つはカバー テキストを表し、もう 1 つは隠されたメッセージを含む暗号文を表します。 結合配布により、2 つのテキストが統計的に区別できないことが保証され、完全に安全なメッセージが生成されます。

ソコタ氏、シュレーダー・デ・ウィット氏、および彼らのチームは、深層学習への新しいアプローチのためにこのツールを活用する方法を見つけようとしていました。 しかしある日、彼らの共同研究者である Martin Strohmeier 氏が、最小エントロピー結合に関する彼らの研究を見てステガノグラフィーに関するセキュリティ問題を思い出したとソコタ氏は思い出しました。

シュトロマイヤー氏は何気ないコメントをしていたが、ソコタ氏とシュローダー・デ・ウィット氏はそれを真剣に受け止めた。 同グループはすぐに、最小エントロピー結合を使用して、現実世界の機械学習システムのコンテキストにおける完全なセキュリティに対する Cachin の要件を満たすステガノグラフィー手順を設計する方法を発見しました。

「ステガノグラフィーにこれほど優れた用途があることを知って驚きました」とパデュー大学の電気・コンピューター技術者ムラット・コカオグル氏は語った。 彼はステガノグラフィーには携わっていませんが、チームが論文で使用したアルゴリズムの 1 つの設計には協力しました。 「この研究は本当に最小のエントロピー結合にうまく結びついています。」

次にチームはさらに進んで、ステガノグラフィー方式の計算効率を可能な限り高めるには、最小のエントロピー結合に基づいている必要があることを示しました。 新しい戦略は、セキュリティと効率性の両方を達成する方法について明確な方向性を示し、この 2 つが連携して行われることを示唆しています。

「私たちの結果は、これが完全に安全ではないアプローチよりもさらに効率的であることを示唆しているようです」とソコタ氏は述べた。

制限があります。 Cachin 氏は、真の最小エントロピー結合を見つけることは NP 困難な問題であると指摘しました。これは基本的に、効率の問題に戻り、完璧な解決策は計算コストが高すぎて実用的ではないことを意味します。

Sokota と Schroeder de Witt は、その問題を認識しています。つまり、最適な結合は実際には計算するには複雑すぎるでしょう。 しかし、そのボトルネックを回避するために、著者らは Sokota と Schroeder de Witt によって開発された (そして Kocaoglu によって導入された方法に基づく) 近似手順を使用しました。この手順は依然としてセキュリティと合理的な効率を保証しています。

実際にどのように機能しているかを彼らは次のように考えています。反体制派または人権活動家がロックダウンされた国からテキスト メッセージを送信したいと考えているとします。 シュローダー・デ・ウィット氏は、WhatsAppやSignalなどのアプリのプラグインがアルゴリズムの重労働を行ってくれるだろうと述べた。 最初のステップは、暗号文を隠すカバー テキストの配布、つまり、ChatGPT または同様の大規模言語モデルから得られる、メッセージで使用できる単語の巨大なコレクションを選択することです。 次に、プログラムはその言語モデルを使用してカバー テキストと暗号文の間の最小エントロピー結合を近似し、その結合によりテキストで送信される文字列が生成されます。 外部の敵対者にとって、新しいテキストは、無害な機械が生成したメッセージと区別がつかないでしょう。 また、テキストである必要もありません。このアルゴリズムは、たとえば、ボイスメール用に機械で生成されたアート (ChatGPT の代わりに) や AI で生成された音声をサンプリングすることによって機能する可能性があります。

新しいアルゴリズムは、秘密メッセージのサイズの点で制限されています。シュローダー・デ・ウィット氏は、今日の技術を使えば、彼らのシステムは約 30 秒間の機械生成ボイスメールの中に約 225 キロバイトの画像 (または他のメッセージ) を隠蔽できると推定しています。 しかし、成功するためにそれが巨大である必要はありません。 実質的なメッセージが検閲や当局を通過するにはこれで十分です。

フリードリッヒさんは、理論を考えるよりも、現実世界の制限に対抗することに慣れていると語った。 「反対側を見るのは興味深いです」と彼女は言いました。 彼女にとって、新しい作品は理論的な証明と現実世界の混乱の間のギャップを埋めるものになり始めています。 人々が機械生成されたコンテンツを使用しない場合、新しいスキームはセキュリティを保証しません。 しかし、それがより広範に普及するにつれて、完全なセキュリティの可能性はさらに高まるだろうと彼女は述べた。

「すべては、何が典型的になるかによって決まります」と彼女は言う。 機械が自然に見える無害な画像を生成し、人々がそれらに慣れれば、秘密のメッセージが豊富に含まれた画像ソースを簡単に作成できるようになります。 「生成モデルを使用すると、このアプローチは 2 つのアプローチが出会う可能性のある道筋を与えてくれます」と彼女は言いました。

明らかに、それは両刃の剣でもあります。 フリドリッヒ氏は、「犯罪者が利用するだろうが、良い目的にも利用できる」と語った。

寄稿者

2023 年 5 月 18 日

Quanta Magazine を受信箱に届けてください

メールの受信箱に配信される最も重要なニュースのハイライトを取得します

Quanta Magazine は、情報に基づいた実質的な市民的な会話を促進するためにコメントを管理します。 虐待的、冒涜的、自己宣伝的、誤解を招く、支離滅裂、または主題から外れたコメントは拒否されます。 モデレータには通常の営業時間 (ニューヨーク時間) にスタッフが常駐しており、英語で書かれたコメントのみ受け付けます。