ACM輪講
"Strategic Directions in Electric Commerce and Digital Libraries:
Towards a Digital Agora"
川合研究室 B4 伊戸川 暁
1997年7月2日作成
1997年7月2日最終更新
- Introduction
- 電子商取引(Electric Commerce, 以下EC)と
デジタル図書館(Digital Libraries, 以下DL)は、
一見全く別の事柄を扱うように見えるが、
実は両者の構造は相当に共通している。 例えば:
- (multimedia )objectを作成し、それをnetworkに流通させる点
- 送り手(provider)と受け手(consumer)の存在
- 自律したサーバーの集合が共働して、
受け手に一貫した情報を提供する点
- 様々な種類の送り手が様々な種類の媒体を利用できる点
- 利用するインフラの共通点:
- ネットワーキング
- 安全対策
- 検索・広告
- 対話・引き合わせ(matchmaking)
- 契約・注文
- 請求・支払い・製作・配布・記帳
- 等々の顧客サービス機構
- ECとDLは相互に関係しあってもいる。
- Section 2 ではEC/DLで重要な6つの下位領域について検討し、
Section 3 ではEC及びDLの実例を見ていく。
- Challenges
「6つの下位領域」とは、以下の通り。
- 情報の獲得と蓄積(Acquiring and Storing Information)
- 情報の検出とふるい分け(Finding and Filtering Informarion)
- 情報の保護とアクセスの監視(Securing Information and Auditing Access)
- 普遍的な(?)アクセス(Universal Access)
- コスト管理と金融機関(Cost Management and Finantial Instruments)
- 社会生態学的インパクト(Socioeconomic Impact)
- 情報の獲得と蓄積
- ECもDLも、情報の獲得と蓄積から利益を得る
(情報を獲得する過程と蓄積される情報の内容は異なっているが)。
- ともに、contentを更新/追加する仕組みが必要になる。
取り組むべき課題:
- 既にあるcontentの更新を容易ならしめること
- バージョン管理
- 共同作業を容易ならしめること
- 受け手が送り手になれるような手段の提供
- 大量の、未だデジタル化されていないcontentsの存在
- 既に未だデジタル化されているもののデータ変換の問題
- 既存のメディア(新聞・TVなど)のデジタル化に関係した課題:
- コスト/品質の問題
- OCR技術の改善
- デジタル化になじまないobjectをどうするか
- 連続的メディア(動画などか?)の実時間処理
- 大規模なobjectの取り扱い
- 情報の送り手(Information Provider)
- WWWで示されたように、Internetにアクセスする者は
皆「送り手」になりうる。重要な問題は、
各個人の寄与をどう組織するかである。
- 評価基準はどうあるべきか?
- 「ポインタのみ」か、全文引用か?
解決手段の一つとして、「online mall」の形式を用いることが
考えられるが、これでは真に世界規模の取り引きをするのに
必要な、大規模な情報は集められないだろう。
- 特徴抽出(Feature Extraction)
-
- 普通、(画像などの)特徴に関する情報(metadata)が、
queryに応えるために用いられる。
- queryは、単純な一致のみならず、時間や空間などの関係を指定したり、
曖昧な一致もsupportする(べきである?)。
- テキスト・音声・画像・動画にわたる
適切な特徴抽出機構の実現は一つの課題であるが、
音声解析・画像認識・パターン認識の膨大な成果の割には
満足のいくものはできていない。
- 或るmultimedia objectから特徴を抽出して、それに似た
objectを取り出せるとか、出来たらいいなあ。
- それには、適切な特徴を挙げさせるquery言語体系と、
その特徴を賢く抽出するmethodが必要だろう。
- 品質水準(Quality level)
-
- 受け手によって要求する品質の水準は異なるであろうから、
送り手の側は、同じobjectから、
品質が異なる幾つかの版を生成できなければならない。
- (ECでは、買い手は、値段が安ければ画像の質が悪くても
文句を言わないだろうし、
売り手にしても、送るバイト数の少ない方が経費を節減できるわけだが…。)
- resourceそのものの価値ではなく、
'opportunity cost'(或るresourceに対する需要と供給の関係性)が
resourceの価値を決める物差しになりうる。
- 画質の評価:人間の目は最小二乗法(?)に従わないので、
心理学や神経生理学なども動員しつつ、
知覚の原理に則った「画質」の尺度を開発する必要がある。
- 情報の探索とふるい分け
- 受け手は、容易に自分の欲しい情報が手に入ることを望む
- 故に、受け手と送り手を引き合わせる'Matchmaking Program'は、
以下のような要件を満たすべきである。
- 名前よりも「すること」で
serviceを記述できること
- 内容に基づいた検索をかけられること
- 様々なサーチエンジンの、質の異なった情報群から
新たな関係を「掘り当てる」機能を有していること
- この分野に於ける課題は、次のようである。
- 様々なシステムから情報を検索して、そこから
潜在的なdata sourceを引き出す、様々な効果的な
手段を受け手に提供すること
- 様々なデータの種類について、統一性があり、カスタマイズがきき、
y且つ動的なuser interfaceを開発すること
- 特定のデータ型(地図・3次元データなど)に特化した
user interfaceをも開発すること
- それぞれの受け手にとって、最も馴染みの深い
用語法を使わせられるようにすること(ontologies(…存在論?))
- 送り手が受け手の性向を知り、受け手が送り手の製品やサービスの
隠れた傾向を知るのを(data-miningによって?)容易ならしめること
- 話をECに限れば、次のような課題もある。
- 買い手が、特定の特徴を持った製品やサービスの所在を知り、
売り手が、自分の商品の潜在的顧客がどこにいるのかを
調べられるような仕組みの創出
- 安全な競売システムの提供
- 仲介者と引き合わせサービス(Agents and Matchmaking Services)
-
- agent研究の重点: DLでは利用者と目的の情報を引き合わせること、
ECでは売り手と買い手を引き合わせること。
- agentは既に存在し、取り引きを行っている。
- agentの定義はピンからキリまであるが、
それらの分類に役立つ指標は
の3つである。userの行動から学んでいくagentもある。
- ロボット(スパイダー|クロウラーとも)はagentの一例
- decision agent : 受け手の移行を受けて送り手側と取り引きし、
所望の情報を手に入れたり、買物をしたりする。
- demand agent : decision agentと取り引きをし、
その際に受け手側の情報を引き出すという、
送り手側にとってはまことに有難いagent。
- agent間の対話については、interfaceの規格化が必要になる。
- matchmaking(引き合わせ)とは、
或る条件のobjectを探している受け手が、
その条件にかなうobjectを持っている送り手に
出合う過程のことである、といえる。
- しかし送り手側の表現と受け手側の表現は違うかもしれない。
- (schema|data)-integration problem
- 秩序だっているいないに関わらず、複数の情報源をもとにして
matchingのofferをするという目標。
- 正確/曖昧一致:matchの効率を高める技法。
Tsimmis Projectでは、query及び結果の
文字列は、system内部ではagent間の共通表現に置き換えられる。
- data構造やquery言語の翻訳により、matchingはより容易に
なるだろう。 →KQML
- 存在論(Ontologies)
-
- 概念やobjectの間の関係を定義づけたもの。
- 各々の目的に応じた様々なものがあり、
或るものは特定領域の辞書のように用いられ、
また或るものは分野間の言葉の橋渡しをしている。
- 主に、DLでは検索の便宜のために、
ECでは取引の円滑化のために用いられる。
- ECでは関係の構造を明確にするontologyが求められるのに対し、
DLでは広範囲の知識をcoverすることの方が求められる。
(例:物理学者が化学について調べる場合を考えよ)
- ontology記述用言語(LOOM, Epikit, Algernon等)、
及びそれらの翻訳手段(Ontolingua)の存在
- データ採掘(Data Mining)
-
- 巨大なデータの山から「関係」を取り出すこと。
- DLは、文書のみならずデータベースをも内部に含み得る。
- 受け手の、情報へのaccessのpattern、及び
商品購買のpatternは、実に興味深い情報である。
これらの情報を解析して意志決定に資する知見を得る
プログラムの開発が待たれる。
なんとなれば、送り手は受け手の行動パターンの情報を
渇望しているからである。(?)
- 受け手の側にしても、data miningで得られる知見は
重要である(例:株式投資をする場合)。
- デジタル空間上の人々の行動を解析するために、
色々な統計学的手段が緩用されているが、
まだ複雑なデータを十分に扱い切れないでいる。
- 問い合わせの拡張と改善(Query Expansion and Refinement)
-
- 複数のEC/DLシステムに対してqueryを打つと、
膨大な量の返事が返ってきてしまうので、これを
何とかしなければならない。
- 'query expansion' → 複数のserverから同類のobjectを調べる
'query refinement' → 検索結果に対して絞り込みをかける
- query expansionはsemanticsの問題であるが、
query refinementはむしろinterfaceの問題である(?)。
- (飛行機の予約の例、「南北戦争に関する情報」の例)
- 情報の保護とアクセスの監視
- 私的objeectの不正な使用の制限・利用者のプライバシーの保護・
知的所有権の保護が実現されなければならない。
- 「課題」:
- 分散した環境のもとにある複数の利用者が、
内密の情報をやりとりできるようにする手法の確立
- 簡便かつ安全な支払い機構の開発
- 匿名でaccessや支払いができるような仕組みの開発
- 知的所有権の保護
- 秘密を守りつつobjectの監査ができるような仕組みの開発
- 詐欺に強い安全な処理システムの開発。
秘密性やintegrity(?)の保護・認証・nonrepudiation(?)。
- 安全性と秘密性(Security and Confidentiality)
-
- 包括的なデータ保護のpolicyの定式化・詳述・運用が
研究上重要である。
- securityの3つの側面:
- Confidentiality
- 認証を与えていない者から、object及びそれへのaccessを
保護することに関係
- 'release policy'には、「見せる/見せない」のみならず
「誰から金を取るか」といったことも含まれる
- 「時間に関する情報」が重要(らしい)
- Authenticity
- objectの原本を作者/所有者に関連づけることに関係
- 共著のauthenticityをどうするか?
- Integrity
- objectが不正に改竄されないようにすることに関係
- authenticityは確実なintegrityに基づく
- 安全なシステムの構築のためには以上の3つに気をつけなければならない。
無論、性能とのtrade-offも考慮する必要がある。
- 大きな問題は、(送り手ごとに異なるであろう)policy同士の
相互作用である。policyの相違は、systemの相違の一部として、
はっきりと意識されなければならない。
- 新たな技術が、部分的にではあるがEC/DLの安全装置を
形成しつつある。例えば:
- デジタル署名・signature・暗号化
- データベース技術の熟成(分散データベースなど)
- ホログラム記憶や検索の技術 → IDカードなどへの応用
- 知的所有権(Intellectual property rights)
-
- objectの移転は、知的所有権の一部或いは全部の移転を伴う。
従って、EC/DLでこれをどう扱うかの枠組が必要になる。
- 「疑わしい」類似物を検出する方法が考案されているらしい。
- 不正コピーについては、一度行われれば何万何億と
コピーされうるわけで、従って追求しづらくなるあたりに
難点がある。
'text flickerling'なる技法が編み出された
らしいが、詳細は不明。
- 普遍的なアクセス
- EC/DLは、(TV・ラジオ・PC・PDA・ノート機・携帯電話といった)
様々なメディアから利用できるべきだろう。そしてそれは、
既存のメディアを含む
いかなるメディアに対しても、interoperability(透過性?)を
持つべきだろう。
- Interoperability
- software工学から出た概念
- 複数種のデータベース間のデータのやりとりをどうするかという問題
- 'Workflow'(組織内の仕事の割り当てを管理するものらしい)
- 枠組の単純化と標準プロトコル(HTTPみたいな)の整備
- User Interface
-
- 受け手に大量のデータを扱わせるには、
直観的interfaceが不可欠
- 「視点のスムースな切り替え」ができたらかっこいいね。
- Networking
-
- EC/DLの今後の発展は、ひとえにnetworkの発展にかかっている。
- ECとDLでの違い
- 「受け手」の着実な増加とマルチメディア化により、
必要な帯域幅は増えているが、現在の帯域幅では
EC/DLをまかない切れないだろう。
- communication costの問題
- コスト管理と金融機関
- 主にECの方に関係のある話だが、DLにとっても全く無関係ではない。
- 世の中には色々な金融機関やcost modelがあるはずなのだが、
EC/DLに関しては、あまりこの方面の研究は進んでいない。
- cost modelも、変化に鈍い固定コストモデル
(fixed cost model)しか存在していないようだ。
- 以下のような研究が行われるべきである:
- evolving cost model(??)
- 安全で、規格に則っており、広く使われ得る金融システム
- 競売などの複雑な対話、及びpurchasing task(?)のsupport
- コスト管理(Cost Management)
-
- 現在の情報システムは、時間単位、或いは
requestごとに課金を行っている。
一度料金体系が設定されたならば、
それはmanualで直すまで固定されたままである。
- 受け手にはコスト最小化の方策を、
送り手にはビジネスチャンスを活用する方策を与えるべきだ。
- 需要と供給の関係に基づいて、自動的に
情報の値段(できれば価格体系も)を決定するalgorithm
- 受け手の立場からすると、送り手側から請求される代金は
通常は適切なものだが、しかしそれは固定された
(=市場原理で決まったわけではない)ものである。
- 新聞購読の例→過去の履歴から、
バラで買うか定期購読するかなどを決定できた方が望ましい
- 金融機関(Financial Instrument)
-
- 現存するものは以下の通り。
- 電子現金(Digital/Electronic Cash)
- 銀行がlocalな貨幣を流通させるという
古典的なモデルに則っている。決裁は
暗号化された「サイバー紙幣」で行われ、
銀行がそれらを検証する。
実例:
DigiCash社のEcash
- 電子財布(Electronic Wallet)
- クレジットカードが暗号化されて各利用者のコンピューターに
納まっていると考えればよい。買い手は売り手に
暗号化されたカード番号を渡すことになる。
実例:
CyberCash Wallet
上2者は、買い手が事前に売り手と関係を結ばなくて済む点にあるが、
暗号に関する法的規制が普及の障害となる。
- 電子データ交換(EDI)
- 取引先同士がビジネス情報をやりとりする(?)。
古くから電話回線やVANを通じて用いられてきた方式で、
最近は公開鍵暗号で暗号化したデータをInternet経由で
通信することもある。
- 競売(Bidding and Negotiation)
- 発注人は求める製品の仕様を書き、適当な請負人に
入札を促す。各々の入札の内容は、specや納期や価格が
異なっているだろう。発注人は最も良い条件を出した
請負人を選び、後日支払いを行う。発注人と請負人は
更に話し合って詳細を詰める。
以上の過程は、電子メールや洗練されたEDIで行うことが出来るが、
これらの過程を自動化する研究が始まっている。
ちなみに、1996年のノーベル経済学賞は、この分野の
研究に関するものだった(そうだ)。
- 複雑な商取引を最適化するアルゴリズムの開発:
- 電子取引システムの可否はまさにこれに懸かっている
- 関係データベースの最適化アルゴリズムとは
区別して考えるべきである(応用は利くが)。
- Internetからいちいち関連データを引き出すのは
手間がかかり、またそれを解析する手間も
膨大なものとなる。両者の適当なtradeoffを
探さねばならない。
- 十分な複雑さを持った実験的システムも欲しい。
- 社会生態学的インパクト
- 社会一般との軋轢の危険の存在
- 以上に挙げた新技術の効果的な運用のためには、
まず広く一般に問題を知らしめ、それから
他の領域の人達との話し合いに入る必要がある。
- 以下に挙げるテーマは、(原著者からの)問題提起に過ぎない(そうだ)。
- 経済(Economics)
- 問題になりそうな事柄:
- 労働指向から情報指向へ - 新たな訓練が必要になる
- 事前には分からない情報へのcostの決定
- 知的所有権の保護
- 仕事の分量・範囲が広がる
- 電子的な給与支払方法?
- 人材(Human Resources)
-
- 驚くほどの文盲の多さが明らかになる
- しかしこれは教育が解決するだろう
- 法律・政府(Law and Governments)
-
- 各国政府はECへの政策の枠組を協議すべし
- ECでの犯罪行為は、policyと技術で解決していくべし
- 社会(Society)
-
- 文化・言語の問題 - 英語支配への反発
- プライバシー・安全性(Privacy and Security)
-
- 暗号の輸出規制は撤廃されるべきだ
- 学問間の交流(Multidicipline and Interaction)
-
- 大事だろう。
- Case Studies
手抜きしてます。すいません。
- Summary(略)
itogawa@graco.c.u-tokyo.ac.jp