ネットワーク環境に於ける電子文書の保存及び管理
86802 川合研M1 伊戸川 暁
- Surveyより
富士通のSecure Archiver
昨日知ったばかり。^^;
富士通は、1998年2月16日付で
「世界初の電子化データの原本性保証文書管理システム・Secure Archiver」
を開発したと発表。
「原本性(authenticity)の保証」に重点があるようである。
概要:
- 製品はハードウェアの姿をしている(専用ボード+MOディスク)
- 専用ボードには「改竄検出用専用LSI」が搭載されているそうだ
- 登録時に識別情報を生成し、文書の一意性を保証
- 識別情報は文書の電子署名+serial番号+
Secure ArchiverのID+記憶媒体のIDより成る
- 原本と写しとの区別
- networkを通じて原本及び写しが転送できる。
- ここで、原本を移動した時は、時刻情報及び移動履歴が識別情報に付加される。
- 研究の動機/目的
- 電子文書の適切な管理は緊急の課題
- フローとしての電子情報だけではなく、
ストックとしての情報にも目を向けるべき
- 長期間にわたって電子的記録を適切に管理・保存するシステムの必要性
- 「適正」→出所が正しく伝えられること(Authenticity)、
内容に改変が加えられないこと(Integrity)、
情報が保護されるべき時には保護されること(Confidentiality)
図1: 卒研1で提唱したシステムの概念図
- 前回(卒論)でやったことの反省と、今後の方針
- 前回は「文化」とか「歴史」といった辺りで少々肩肘張ってしまったが、
今回はもう少し醒めて行きたいと思う
- 前回は主に仕様を述べて、実装は殆んどやらなかった
- なんだか、表現形式がplain textであるというだけで、
恐ろしく効率の悪いRevision Control System兼Archiverを作ったに
過ぎないような気がする。
- Security系の充実を図りたい
- 今回は、権利関係がより複雑になるであろう私的な文書の管理についても
challengeしてみようと思う。
- なるべくソフトの範囲内で話をつける指向性でいく
- システムにハード依存の部分はあるべきではないと考える。
- ハードウェア技術も無視できないのは事実なのだが。(例: RAID)
- 積極的にネットワークを利用する
- マルチメディアへの対応は、忘れたわけではないが、優先順位は低い
- 諸問題及びアイデア
えらく話が分散しておりますが……。
要するに、まだまだ問題山積ということです。
- (メタ)データ及びその構造
- ドキュメントの二次元モデル
- 文書の階層(directory)構造の次元 + 経時的変化の次元
- データ及びメタデータは、全てXMLによって記述
- これらの情報は自らOODBを成す(はず)
- ファイルの部分ごとにmetadata(更新履歴・所有者情報など)を記述できないか?
- 例えば、「ほげほげ」が、時刻somedayにanother@personによって
「ほげほにゃ」に書き換えられた場合、
ほげほげ
↓
ほげ
<history>
<original>ほげ</original>
<replaced date="someday" by="another@person">
ほにゃ</replaced>
</history>
のように記述する。
- ご利益→肌理の細かいaccess管理が可能になる、
文書の細分化された各部分について責任が明確化される
- 課題: 元から書いてある「ほげ」と 後から書き直した「ほげ」は
区別されるべきか?
- 他の文書へのリンク・annotationの扱い?
- URL腐敗(或いはそれに類するもの)への対策が必要
- コード系及びデータ形式の問題
- 扱われるデータの形式を問わないものにしたい
- テキストだけでもいろいろ、加えて画像などの諸形式
- →XMLは骨組みとしてだけ使用。
しかし、binary dataについてもSGML式の記述は有効なのか?
- 文字コードに関する問題
- 将来に亙るsoftwareの動作を保証する必要性
- ソースとまでは行かなくても、仕様書くらいは
どこかに保管するようにしたい。
- データをどう変換するかの規則を明確に定義すれば、
極端な話、ハードウェアがなくなっても大丈夫、と思うのだが……。
- 情報の取捨選択
- それは必要か? 必要なら、それはどうやればいいのか?
- ここで必要なのは、「歴史的重要度」という観点から見た
Information Filteringということになるのだろうが、
そんな高水準のfilterlingは果たして可能なのか?
- 卒論では「事前に決定したRetention Scheduleによる」としたが、
本当にそれでいいのか?
- # やはり、自動生成とかできたらすごいのだが。
- ネットワークを介した文書の転送
- ほぼ統一されたプロトコルを有する強み
- 容易に複製を持つことができ、また、
それによって文書の唯一性を克服することができる
- 応用例: 式年遷宮方式
- 図2を参照のこと。
図2: 式年遷宮方式・概念図
- Security Model(認証・信用系)
情報を滅失から保護するのもまたsecurityの問題と言えるであろう。
- 利用者の種類と権限に関するモデルをどうするか?
- 誰を信用するか? そしてそれをどのように表現するか?
- → Hierarchicalモデル 対 信用の輪モデル(PGPが採用しているような)
- データの各部分は、情報の作成者、及び改変等の権限ある人の情報を持つべし
- 人に関する情報も、networkを利用する関係上、
全世界からnetwork越しに参照できる形式である必要があろう。
- 無論、file以下の単位についてこれらの情報を持てることが望ましい。
- 時間情報が重要になる
- 情報の抹消なり開示なりは時刻によってcontrolされるので、
(特に時系列に対して)動的なsecurity modelが必要になる。
- 索引・検索
一応計画には入っているのだが、まだあまりきちんと考えていない。
……少し範囲を絞った方がいいかもしれませんね。
- todos(すべきこと)
とにかく基礎体力をつけないと。
- Security関連の勉強
- さしあたり、sshをinstallするあたりから始めてみようと思います。
- XMLの勉強
- リンク構造の部は要注意と見た。
- toolのinstall:)
- 前回話だけして実装しなかった部分の実装作業
- 実装した部分も作り直し
- etc...
itogawa@graco.c.u-tokyo.ac.jp