CA600 - 英国図書館の蔵書目録データベース化 / 原井直子

カレントアウェアネス
No.118 1989.06.20


CA600

英国図書館の蔵書目録データベース化

英国図書館(British Library)は,蔵書目録(The British Library general Catalogue of printed books to 1975. 以下BLC)のデータベース化プロジェクトを現在進めている。冊子体での刊行は1987年に終了しているが,このプロジェクトでは機械可読形へ変換しようというもので,完成すれば世界的にみても最大級の書誌データベースとなろう。1975年以降に受け入れられたものは既に入力され利用されているのでこの遡及入力作業により,オンライン検索も利用価値はずっと大きなものとなろう。

BLではこの遡及入力事業を,St.Pancras新館への移転につぐ重要なものと位置づけている。1987年にスタートして,1991年に完成を予定しているが,この1991年という時期は,新館への第一期移転にあわせたものである。新館では目録へのアクセスはオンラインで行われることになっている。また,このBLCデータベースは,BLAISE-LINEサービスでも利用できるようになるはずである。

入力作業を契約したのはSaztec Europe社で,実際のプロジェクト進行は,Saztec Europe社とBLのプロジェクト・チームとが協力して行われている。作業は大きく三つの段階に分けられてる。最初がデータの入力とコード化,次がUKMARCフォーマットにあう形への加工,三番目が磁気テープ化と品質管理である。入力段階では標目と記述とを別々にしている。標目の部分はリストを出力し,BLに送られる。BLではプロジェクト・チームが標目,副標目が正しく階層構造となるようコード化する。記述部分はSaztecで書誌的な基準に従って各々の要素をコード化する。そしてBLより送り返されてきたデータと統合される。品質管理の段階では,Saztecで磁気テープに出力したものをBL側がチェックする。サンプルが要求するだけの精度を備えていれば,それはBLに納められる。

その後,最終的には,“圧縮加工(compression process)”と呼ばれる作業が行われる予定である。前記の入力作業はBLCの冊子体の最初から順に,つまり標目のアルファベット順に行われている。入力作業終了時点では,主記入,副出記入の関係づけは一切無い。これらをリンクさせ,1件につき完全なユニット・レコードを作る作業のことを圧縮加工と呼んでいるのである。

現在,プロジェクトの進行状況は良好である。BLC全360巻,約400万件の内,1988年9月現在で,106巻の入力が無事終了してBLに納められている。これは全体の1/4以上で,予定より早い進度である。プロジェクト初期には,ソフトウェア不備,データ入力時の障害等,問題もあり遅れがちだったが,1988年4月には予定に追いつき,現在では予定を上まわるペースとなった。

近い内に,BLAISEでの利用も試験的に開始されることになっている。この試験ファイルには約25万件のデータが入っている。ただ,このデータは圧縮加工はされていない。参照が一般参照さえ無く,主記入のみとなっている。

また,プロジェクト・チームはこのBLCデータベースにUKMARCを付加することを検討している。UKMARC中の1970年以前刊行で1975年以降に受け入れられた資料のデータをBLCに統合しようというのであるが,今のところ,これは大いに有望である。

もう一つ検討されているのは,ローマ字以外の文字セットでディスプレイできる端末である。ボタンで切り換えて他のアルファベット(例えば,キリル文字,ギリシャ文字,ヘブライ文字等)を検索に使えるようなキーボードを考えている。英語以外,例えばロシア語でも検索後に使えるようになるわけである。ただ,これについては,まだ残された問題が多い。

原井直子

Ref. Oddy, Pat. British Library Catalogue Conversion. BLBS Newsletter. 43. Jun.1987.
Clark, Pat. British Library Catalogue Conversion. BLBS Newsletter. 47. Oct.1987.