KTYYゼミ資料
伊戸川の今後の予定について
1998年1月13日 川合研B4 伊戸川 暁
前回までのあらすじ
初志
相次ぐ官吏の不祥事、戦争責任のウヤムヤさ加減など、 我々は過去から目を背け過ぎている
文書保存がデタラメなのは、原因とも結果とも言えよう
また、情報科学の方面でも、 この辺りの話は 世界的にもあまりツメられてはいないだろう
上のように考えて、「電子文書館システム」なるものについて 卒論を書いてみようとし、実際一応書いたのだが……。
「電子文書館システム」とはどういうもので、何を目指しているのか
組織体が日々生産する電子文書を適切に収集し、
それらを十分なタイムスパンに亙って管理・保存する
集められたファイルは時間とともに廃棄されるなどの篩にかけられ、 最終的に残った文書は、一般にネットワークを介して公開となるものとする
反省
「俺がこれを研究しなければ日本の夜明けが100年遅れる!」 みたいな妙な「気負い」だけでやっていて、 surveyなどがそれに追い付いていかなかった。
「Archivistの人たちが余りにも辛すぎる」という「おせっかい」だけで 突っ走ってしまった部分が大きい。 例えば、「文書館は図書館とは違う」という主張を真に受けすぎた結果、 Digital Library関係の論文に背を向けてsurveyが偏ってしまった、とか。
啓蒙運動が先っぽい気もしないではない
要するに、JournalismですべきことをAcademismでしてしまったような気がする
上に述べた遠大な(?)計画の一部しか卒研ではできなかった
更には、「retention scheduleを事前に設定する」 という、卒研で採用した方針が最良とは限らないかもしれない
結論: やはりまだまだ勉強が必要。
とりあえずのサーベイ
社会的状況
以下の通り、研究をする機運は整いつつある(やる/やらないはともかく)といえる。
情報公開法関連の議論が盛んになってきている
「情報公開法制の確立に関する意見」 (行政改革委員会、 http://www.sorifu.go.jp/whitepaper/gyokaku/joho/)・
「「情報を市民に!情報公開法の制定に向けて」 (http://www.butaman.ne.jp:8000/~kubotani/)などに関連情報あり
ようやく日本のArchivistがWebで動き出した模様
Archivists in Japan(http://www.bekkoame.or.jp/~tosiharu/archivists/)・
全国歴史資料保存利用機関連絡協議会関東部会(http://www.edu.gunma-u.ac.jp/~shozawa/zensikan.html)などの存在を確認
国立公文書館のホームページも出現
ただし所在地はhttp://www.kt.rim.or.jp/~flinthil/Japan.html/index.html。 真上が一見ただのバンド好きのページであるところが悲しい。 但し、責任者のメールアドレスがarchives@sorifu.go.jpだったのは不幸中の幸い。
Power Doc
内田洋行が開発した公文書管理システム 。
国産の商用システムも存在していた。未来は明るいかもしれない。
DocPort
という姉妹品もある模様(ただしこれは、紙文書をscanして管理するというものみたい)。
→やはり、既存・あるいは将来出現するだろう 商用システムへの対応は重要かもしれない。
東京大学史料室
本学にそういう部局があるらしいので、そのうち訪問してみようと思っている。
総合研究博物館との関係やいかに?
先行研究なまかじり
マルチメディアデータベースシステムのためのストレージシステムWAKASHI/C (白・天野・牧之内@九大工学部情報工学科)
「出世魚」プロジェクトの一部。システム設計上参考になりそう。
履歴管理機構を持ったファイルマネジャの設計 (鈴木・北川・大保@筑波大、『データベースシステム』96-9、1993)
ページ単位の履歴管理を行うファイルマネジャに関する話。 ただし、データベース用のファイルマネジャについて述べているので、 自分の研究に使うには読み替えが必要そう。
古文書コピーによるファイル回復機構の解析 (福本・中川@愛知工業大、『電子情報通信学会論文誌』Vol.J-79-D-I, No.4, 1996)
「古文書」で引っかかったので見たのだが、 バックアップを取る適切な間隔を評価する話だった。
いずれも、ファイルシステムに関して使えそうではある。
原田さんのFreya
任意の形式→FDIFで収集・検索に持っていけるので、これを使って何かやれそう。
アイデア
rotten link対策
URLよりも移転や消滅に強い文書命名体系、例えばURI関係。 →uri@bunyip.comなどで議論中、RFCも若干ある。
データベースは階層的に構成できるべきである
データ独立性
データの寿命 > アプリケーションの寿命。 →アプリはOpen Systemであるべき
ネットワークを利用した文書保存・管理のためのプロトコルの開発
サーベイ必要。
Todos
とにかく学習
卒研でやったサーベイなどサーベイではないと悟る。
記録管理学・ファイルシステム・データベース設計法・各種規格など、 極めて広い範囲にわたる勉強が必要そう。
関連学会に積極的に接触を図る
情報処理学会は当然として、記録管理学会、全史料協など。
その他、現在興味のある関連領域
漢字コード問題
「東京大学漢字プロジェクト」はどうなったのだろうか?
マルチリンガル環境
タイポグラフィ
以上3項は密接な関係あり。
Data Mining
「構造化されていない文書(要するにただのplain textなど)から 構造を取り出す」というのは
何らかの生データを収集→編集・解析して、文体上の特徴を抽出するとかして 遊んでみるのも面白そう
# 例えば、「ネットニュースの文体の変遷」とか。 # で、何が何に影響を与えたかを追いかけていく。 # 解析の途上で何か有効なモデルが作れたらしめたもの
Agent関係
むしろこれは卒研II(「集団の形成と発展」)に関係か?
agent間の相互作用が云々って、なにやら楽しそうだよね。
その他の参考資料
震災・復興記録保存問題の課題と展望
http://ccs.cla.kobe-u.ac.jp/Asia/Nakano/kiroku.html
D-Lib Magazine
http://www.dlib.org/
人文学と情報処理
http://www.bensey.co.jp/zinmon/
NetNews Archive
http://mitsuko.jaist.ac.jp/fj/
電子化された行政情報の管理状況の調査結果
http://www.somucho.go.jp/gyoukan/kanri/bun30_2.htm
http://www.somucho.go.jp/gyoukan/kanri/以下は全般的に要チェック。
アーキビストの倫理綱領
http://www.bekkoame.or.jp/~tosiharu/archivists/ica_moral.html
itogawa@graco.c.u-tokyo.ac.jp