卒業研究Iの進捗状況
1997年10月14日
川合研B4 伊戸川 暁
- (現状に於ける)コンセプト
- 公開による保存
- Networkを介して(できるだけ離れたところに)
mirror/ダウンロードしてもらえば、
災害時にも強いだろう(という希望的観測)。
- 自主管理
- B.Kahleのように、よそのserverの内容をarchiveしてあげるという
行き方もあるようだが、
本来自分の所の内容は自分でarchiveすべきであると考える。
但し、自分のところでarchiveしたdata/metadataを、
他所とやりとりすることは 当然否定しない。
- 二面性
- 内側に対しては版管理システム(のようなもの)として振る舞い、
外側に対しては情報を発信する。
(WWWを通じての発信を想定しているが、無論CDなどに焼いてもよい)
- そしてその中間に、蓄積したファイル及びそれを管理する部分がある。
- key technology:
- metedata、公開鍵暗号(、database技術)
- metadata
- metadataとは何ぞや
- dataに関するdata。
e.g. 題名・作成日・著者名・ファイル形式など。
ここにrertension schedule情報を入れて自動管理させるあたりが、
本研究の新機軸である。
- 世界の状況
- ここ1年ばかり進展がめざましく、URCやらRDFやら、各種の提案が
なされているが、まだ標準と呼べるものは確立していないようだし、
私の研究目的に特化したようなmetadataシステムは、
見た限りでは提案さえなかった(ようだ)。
#∴今なら一介の学部生でも好き勝手が言える。
- 本システムに於けるmetadata
- SGML式の表記(外部表現)
- のちに標準が固まった時に移行しやすいだろう
- 入れ子構造
- 階層構造を表現
- revision管理
- 文書の命名法はserial numberとする
- 永続性を重視→URNを意識
- 文書間構造のfilesystemからの分離
→文書の重要度に応じて保存先を変えることができる(重要)
- 本体とmetadataの物理的な位置関係
- 一体型/分離型
- revision情報の管理
- file/directory名が変わってもたどれるようにしたい
- (僕自身、名前をコロコロと変えるので)
- #RCSとの連動を図れないか?
- 記憶媒体情報
- retension scheduleの記述
- dir.単位/file単位
- 保存年限
- 作成時から一定の時間を経過した後
- 一定の時間、アクセスが無いとき
- 等々のvariation
- 機密扱いか否か(see 3)
- どれを残すか?
最後のバージョンだけ? 最初と最後? 全部?
- etc.
- ※具体例は別紙を参照のこと。
- 公開鍵暗号
- 真正性の保証
- (少なくとも)公開する情報にはsignatureをつける。
- 機密保持
- 暗号化した文書をよそのserverに置かせてもらう。
とりあえず実装にはpgpを使う予定。
- 問題点
- 鍵の引き継ぎをどうするか?
- database技術
- metadataを生で扱うといかにも効率が悪そうなので、
この辺りの勉強がもう少し必要そう。
- #でも、本質的な部分ではない(と思っている)ので、
あまり勉強していない…。いいツールをご存知の方、御教示下さい。
- 実装(の予定)
基本的に、shellから専用のcommand群をしようするというinterfaceで済ます予定。
- retension scheduleの設定
- 設定ファイルによる設定
- directory(或いはfile)ごとに、retension scheduleを記しておく
- コマンドによる対話的な設定
#システム施行前に現存する文書群を見て、
retension scheduleをsuggestしてくれる機能があると便利そうだが…。
- record manager
- metadataに記されたretension scheduleに基づいて、
文書/metadataの移動や処分を行う。
- 基本的に自動とするが、手動の余地も当然残す。
- 定期的にworking dir.を見て回り、変更のあったもののみを収集
(或いは複数作る)。
- 各文書/dir.(/metadata?)はserial numberで識別
- #retension scheduleによっては(e.g. logfile)、
currentのを消してあげる
- 廃棄の日を過ぎたものを消す
- 「archives行き」になったものに公開のための処置を施す
- #metadataのみの変更をどうするか?
- #「current且つarchivesの一部として公開」の扱い?
- 専用command群
- metadataの書き換えを伴うcpやmvなど。
- その他
- 索引づけ、よそとの情報交換、Web serverとの連絡など
- 差し当たりWeb周りは簡単なcgi-scriptで済ませるが、
将来的には専用のserverも欲しい
- 今後の予定
実は、殆んど実装が進んでないのです。
- 10月中
- 大急ぎで実装
- 11月
- それを少し動かして論文につなげる
- 少なくとも卒研関係のデータは本システムで管理しよう
- 名前募集
本システムの、気の利いた名前を募集します。
但し、先に自分でいいのを思いついてしまったなどの理由により、
必ずしも採用されるとは限りませんので、あしからず。
itogawa@graco.c.u-tokyo.ac.jp