ACM輪講

"Strategic Directions in Electric Commerce and Digital Libraries: Towards a Digital Agora"

川合研究室 B4 伊戸川 暁

1997年7月2日作成
1997年7月2日最終更新

  1. Introduction
  2. Challenges
  3. 「6つの下位領域」とは、以下の通り。
    1. 情報の獲得と蓄積(Acquiring and Storing Information)
    2. 情報の検出とふるい分け(Finding and Filtering Informarion)
    3. 情報の保護とアクセスの監視(Securing Information and Auditing Access)
    4. 普遍的な(?)アクセス(Universal Access)
    5. コスト管理と金融機関(Cost Management and Finantial Instruments)
    6. 社会生態学的インパクト(Socioeconomic Impact)

    1. 情報の獲得と蓄積
      • ECもDLも、情報の獲得と蓄積から利益を得る (情報を獲得する過程と蓄積される情報の内容は異なっているが)。
      • ともに、contentを更新/追加する仕組みが必要になる。 取り組むべき課題:
        • 既にあるcontentの更新を容易ならしめること
        • バージョン管理
        • 共同作業を容易ならしめること
        • 受け手が送り手になれるような手段の提供
      • 大量の、未だデジタル化されていないcontentsの存在
      • 既に未だデジタル化されているもののデータ変換の問題
      • 既存のメディア(新聞・TVなど)のデジタル化に関係した課題:
        • コスト/品質の問題
        • OCR技術の改善
        • デジタル化になじまないobjectをどうするか
        • 連続的メディア(動画などか?)の実時間処理
        • 大規模なobjectの取り扱い

      情報の送り手(Information Provider)
      WWWで示されたように、Internetにアクセスする者は 皆「送り手」になりうる。重要な問題は、 各個人の寄与をどう組織するかである。
      • 評価基準はどうあるべきか?
      • 「ポインタのみ」か、全文引用か?
      解決手段の一つとして、「online mall」の形式を用いることが 考えられるが、これでは真に世界規模の取り引きをするのに 必要な、大規模な情報は集められないだろう。
      特徴抽出(Feature Extraction)
    2. 普通、(画像などの)特徴に関する情報(metadata)が、 queryに応えるために用いられる。
    3. queryは、単純な一致のみならず、時間や空間などの関係を指定したり、 曖昧な一致もsupportする(べきである?)。
    4. テキスト・音声・画像・動画にわたる 適切な特徴抽出機構の実現は一つの課題であるが、 音声解析・画像認識・パターン認識の膨大な成果の割には 満足のいくものはできていない。
    5. 或るmultimedia objectから特徴を抽出して、それに似た objectを取り出せるとか、出来たらいいなあ。
    6. それには、適切な特徴を挙げさせるquery言語体系と、 その特徴を賢く抽出するmethodが必要だろう。
      品質水準(Quality level)
    7. 受け手によって要求する品質の水準は異なるであろうから、 送り手の側は、同じobjectから、 品質が異なる幾つかの版を生成できなければならない。
    8. (ECでは、買い手は、値段が安ければ画像の質が悪くても 文句を言わないだろうし、 売り手にしても、送るバイト数の少ない方が経費を節減できるわけだが…。)
    9. resourceそのものの価値ではなく、 'opportunity cost'(或るresourceに対する需要と供給の関係性)が resourceの価値を決める物差しになりうる。
    10. 画質の評価:人間の目は最小二乗法(?)に従わないので、 心理学や神経生理学なども動員しつつ、 知覚の原理に則った「画質」の尺度を開発する必要がある。

    11. 情報の探索とふるい分け
      • 受け手は、容易に自分の欲しい情報が手に入ることを望む
      • 故に、受け手と送り手を引き合わせる'Matchmaking Program'は、 以下のような要件を満たすべきである。
        • 名前よりも「すること」で serviceを記述できること
        • 内容に基づいた検索をかけられること
        • 様々なサーチエンジンの、質の異なった情報群から 新たな関係を「掘り当てる」機能を有していること
      • この分野に於ける課題は、次のようである。
        • 様々なシステムから情報を検索して、そこから 潜在的なdata sourceを引き出す、様々な効果的な 手段を受け手に提供すること
        • 様々なデータの種類について、統一性があり、カスタマイズがきき、 y且つ動的なuser interfaceを開発すること
        • 特定のデータ型(地図・3次元データなど)に特化した user interfaceをも開発すること
        • それぞれの受け手にとって、最も馴染みの深い 用語法を使わせられるようにすること(ontologies(…存在論?))
        • 送り手が受け手の性向を知り、受け手が送り手の製品やサービスの 隠れた傾向を知るのを(data-miningによって?)容易ならしめること
      • 話をECに限れば、次のような課題もある。
        • 買い手が、特定の特徴を持った製品やサービスの所在を知り、 売り手が、自分の商品の潜在的顧客がどこにいるのかを 調べられるような仕組みの創出
        • 安全な競売システムの提供

      仲介者と引き合わせサービス(Agents and Matchmaking Services)
    12. agent研究の重点: DLでは利用者と目的の情報を引き合わせること、 ECでは売り手と買い手を引き合わせること。
    13. agentは既に存在し、取り引きを行っている。
    14. agentの定義はピンからキリまであるが、 それらの分類に役立つ指標は
      • 自律性
      • 賢さ
      • 機動性
      の3つである。userの行動から学んでいくagentもある。
    15. ロボット(スパイダー|クロウラーとも)はagentの一例
    16. decision agent : 受け手の移行を受けて送り手側と取り引きし、 所望の情報を手に入れたり、買物をしたりする。
    17. demand agent : decision agentと取り引きをし、 その際に受け手側の情報を引き出すという、 送り手側にとってはまことに有難いagent。
    18. agent間の対話については、interfaceの規格化が必要になる。
    19. matchmaking(引き合わせ)とは、 或る条件のobjectを探している受け手が、 その条件にかなうobjectを持っている送り手に 出合う過程のことである、といえる。
    20. しかし送り手側の表現と受け手側の表現は違うかもしれない。
    21. (schema|data)-integration problem
    22. 秩序だっているいないに関わらず、複数の情報源をもとにして matchingのofferをするという目標。
    23. 正確/曖昧一致:matchの効率を高める技法。 Tsimmis Projectでは、query及び結果の 文字列は、system内部ではagent間の共通表現に置き換えられる。
    24. data構造やquery言語の翻訳により、matchingはより容易に なるだろう。 →KQML
      存在論(Ontologies)
    25. 概念やobjectの間の関係を定義づけたもの。
    26. 各々の目的に応じた様々なものがあり、 或るものは特定領域の辞書のように用いられ、 また或るものは分野間の言葉の橋渡しをしている。
    27. 主に、DLでは検索の便宜のために、 ECでは取引の円滑化のために用いられる。
    28. ECでは関係の構造を明確にするontologyが求められるのに対し、 DLでは広範囲の知識をcoverすることの方が求められる。 (例:物理学者が化学について調べる場合を考えよ)
    29. ontology記述用言語(LOOM, Epikit, Algernon等)、 及びそれらの翻訳手段(Ontolingua)の存在
      データ採掘(Data Mining)
    30. 巨大なデータの山から「関係」を取り出すこと。
    31. DLは、文書のみならずデータベースをも内部に含み得る。
    32. 受け手の、情報へのaccessのpattern、及び 商品購買のpatternは、実に興味深い情報である。 これらの情報を解析して意志決定に資する知見を得る プログラムの開発が待たれる。 なんとなれば、送り手は受け手の行動パターンの情報を 渇望しているからである。(?)
    33. 受け手の側にしても、data miningで得られる知見は 重要である(例:株式投資をする場合)。
    34. デジタル空間上の人々の行動を解析するために、 色々な統計学的手段が緩用されているが、 まだ複雑なデータを十分に扱い切れないでいる。
      問い合わせの拡張と改善(Query Expansion and Refinement)
    35. 複数のEC/DLシステムに対してqueryを打つと、 膨大な量の返事が返ってきてしまうので、これを 何とかしなければならない。
    36. 'query expansion' → 複数のserverから同類のobjectを調べる
      'query refinement' → 検索結果に対して絞り込みをかける
    37. query expansionはsemanticsの問題であるが、 query refinementはむしろinterfaceの問題である(?)。
    38. (飛行機の予約の例、「南北戦争に関する情報」の例)

    39. 情報の保護とアクセスの監視
      • 私的objeectの不正な使用の制限・利用者のプライバシーの保護・ 知的所有権の保護が実現されなければならない。
      • 「課題」:
        • 分散した環境のもとにある複数の利用者が、 内密の情報をやりとりできるようにする手法の確立
        • 簡便かつ安全な支払い機構の開発
        • 匿名でaccessや支払いができるような仕組みの開発
        • 知的所有権の保護
        • 秘密を守りつつobjectの監査ができるような仕組みの開発
        • 詐欺に強い安全な処理システムの開発。 秘密性やintegrity(?)の保護・認証・nonrepudiation(?)。

      安全性と秘密性(Security and Confidentiality)
    40. 包括的なデータ保護のpolicyの定式化・詳述・運用が 研究上重要である。
    41. securityの3つの側面:
      Confidentiality
      認証を与えていない者から、object及びそれへのaccessを 保護することに関係
    42. 'release policy'には、「見せる/見せない」のみならず 「誰から金を取るか」といったことも含まれる
    43. 「時間に関する情報」が重要(らしい)
      Authenticity
      objectの原本を作者/所有者に関連づけることに関係
    44. 共著のauthenticityをどうするか?
      Integrity
      objectが不正に改竄されないようにすることに関係
    45. authenticityは確実なintegrityに基づく
    46. 安全なシステムの構築のためには以上の3つに気をつけなければならない。 無論、性能とのtrade-offも考慮する必要がある。
    47. 大きな問題は、(送り手ごとに異なるであろう)policy同士の 相互作用である。policyの相違は、systemの相違の一部として、 はっきりと意識されなければならない。
    48. 新たな技術が、部分的にではあるがEC/DLの安全装置を 形成しつつある。例えば:
      • デジタル署名・signature・暗号化
      • データベース技術の熟成(分散データベースなど)
      • ホログラム記憶や検索の技術 → IDカードなどへの応用
      知的所有権(Intellectual property rights)
    49. objectの移転は、知的所有権の一部或いは全部の移転を伴う。 従って、EC/DLでこれをどう扱うかの枠組が必要になる。
    50. 「疑わしい」類似物を検出する方法が考案されているらしい。
    51. 不正コピーについては、一度行われれば何万何億と コピーされうるわけで、従って追求しづらくなるあたりに 難点がある。
      'text flickerling'なる技法が編み出された らしいが、詳細は不明。

    52. 普遍的なアクセス
      • EC/DLは、(TV・ラジオ・PC・PDA・ノート機・携帯電話といった) 様々なメディアから利用できるべきだろう。そしてそれは、 既存のメディアを含む いかなるメディアに対しても、interoperability(透過性?)を 持つべきだろう。

      Interoperability
      software工学から出た概念
    53. 複数種のデータベース間のデータのやりとりをどうするかという問題
    54. 'Workflow'(組織内の仕事の割り当てを管理するものらしい)
    55. 枠組の単純化と標準プロトコル(HTTPみたいな)の整備
      User Interface
    56. 受け手に大量のデータを扱わせるには、 直観的interfaceが不可欠
    57. 「視点のスムースな切り替え」ができたらかっこいいね。
      Networking
    58. EC/DLの今後の発展は、ひとえにnetworkの発展にかかっている。
    59. ECとDLでの違い
    60. 「受け手」の着実な増加とマルチメディア化により、 必要な帯域幅は増えているが、現在の帯域幅では EC/DLをまかない切れないだろう。
    61. communication costの問題

    62. コスト管理と金融機関
      • 主にECの方に関係のある話だが、DLにとっても全く無関係ではない。
      • 世の中には色々な金融機関やcost modelがあるはずなのだが、 EC/DLに関しては、あまりこの方面の研究は進んでいない。
      • cost modelも、変化に鈍い固定コストモデル (fixed cost model)しか存在していないようだ。
      • 以下のような研究が行われるべきである:
        • evolving cost model(??)
        • 安全で、規格に則っており、広く使われ得る金融システム
        • 競売などの複雑な対話、及びpurchasing task(?)のsupport

      コスト管理(Cost Management)
    63. 現在の情報システムは、時間単位、或いは requestごとに課金を行っている。 一度料金体系が設定されたならば、 それはmanualで直すまで固定されたままである。
    64. 受け手にはコスト最小化の方策を、 送り手にはビジネスチャンスを活用する方策を与えるべきだ。
    65. 需要と供給の関係に基づいて、自動的に 情報の値段(できれば価格体系も)を決定するalgorithm
    66. 受け手の立場からすると、送り手側から請求される代金は 通常は適切なものだが、しかしそれは固定された (=市場原理で決まったわけではない)ものである。
    67. 新聞購読の例→過去の履歴から、 バラで買うか定期購読するかなどを決定できた方が望ましい
      金融機関(Financial Instrument)
    68. 現存するものは以下の通り。
      電子現金(Digital/Electronic Cash)
      銀行がlocalな貨幣を流通させるという 古典的なモデルに則っている。決裁は 暗号化された「サイバー紙幣」で行われ、 銀行がそれらを検証する。
      実例: DigiCash社のEcash
      電子財布(Electronic Wallet)
      クレジットカードが暗号化されて各利用者のコンピューターに 納まっていると考えればよい。買い手は売り手に 暗号化されたカード番号を渡すことになる。
      実例: CyberCash Wallet
      上2者は、買い手が事前に売り手と関係を結ばなくて済む点にあるが、 暗号に関する法的規制が普及の障害となる。
      電子データ交換(EDI)
      取引先同士がビジネス情報をやりとりする(?)。 古くから電話回線やVANを通じて用いられてきた方式で、 最近は公開鍵暗号で暗号化したデータをInternet経由で 通信することもある。
      競売(Bidding and Negotiation)
      発注人は求める製品の仕様を書き、適当な請負人に 入札を促す。各々の入札の内容は、specや納期や価格が 異なっているだろう。発注人は最も良い条件を出した 請負人を選び、後日支払いを行う。発注人と請負人は 更に話し合って詳細を詰める。
      以上の過程は、電子メールや洗練されたEDIで行うことが出来るが、 これらの過程を自動化する研究が始まっている。
      ちなみに、1996年のノーベル経済学賞は、この分野の 研究に関するものだった(そうだ)。
    69. 複雑な商取引を最適化するアルゴリズムの開発:
      • 電子取引システムの可否はまさにこれに懸かっている
      • 関係データベースの最適化アルゴリズムとは 区別して考えるべきである(応用は利くが)。
      • Internetからいちいち関連データを引き出すのは 手間がかかり、またそれを解析する手間も 膨大なものとなる。両者の適当なtradeoffを 探さねばならない。
    70. 十分な複雑さを持った実験的システムも欲しい。

    71. 社会生態学的インパクト
      • 社会一般との軋轢の危険の存在
      • 以上に挙げた新技術の効果的な運用のためには、 まず広く一般に問題を知らしめ、それから 他の領域の人達との話し合いに入る必要がある。
      • 以下に挙げるテーマは、(原著者からの)問題提起に過ぎない(そうだ)。

      経済(Economics)
      問題になりそうな事柄:
    72. 労働指向から情報指向へ - 新たな訓練が必要になる
    73. 事前には分からない情報へのcostの決定
    74. 知的所有権の保護
    75. 仕事の分量・範囲が広がる
    76. 電子的な給与支払方法?
      人材(Human Resources)
    77. 驚くほどの文盲の多さが明らかになる - しかしこれは教育が解決するだろう
      法律・政府(Law and Governments)
    78. 各国政府はECへの政策の枠組を協議すべし
    79. ECでの犯罪行為は、policyと技術で解決していくべし
      社会(Society)
    80. 文化・言語の問題 - 英語支配への反発
      プライバシー・安全性(Privacy and Security)
    81. 暗号の輸出規制は撤廃されるべきだ
      学問間の交流(Multidicipline and Interaction)
    82. 大事だろう。

  4. Case Studies
  5. 手抜きしてます。すいません。

  6. Summary(略)

itogawa@graco.c.u-tokyo.ac.jp