ウェブアーカイブ

E2182 - 2019年IIPC総会・ウェブアーカイブ会議<報告>

国際インターネット保存コンソーシアム(IIPC;CA1893参照)の総会及びウェブアーカイブ会議(WAC;E2101ほか参照)が,2019年6月5日から7日まで,クロアチアの首都ザグレブで,クロアチアの国立・大学図書館主催により開催された。国立国会図書館(NDL)からは筆者を含む2人が参加した。本稿では,NDL職員2人が参加した会合の内容を報告する。

国立国会図書館インターネット資料収集保存事業(WARP)、「Amebaブログ」の一部を収集・公開

2019年10月1日、国立国会図書館インターネット資料収集保存事業(WARP)は、「今月の特集(2019年10月) - ブログ -」のウェブページを公開し、「Amebaブログ」の一部を収集・公開したことを発表しました。

「Amebaブログ」のサービスを提供している株式会社サイバーエージェントの協力を得て実施されたものであり、特集ページ内に収集対象となったタイトルのリストが掲載されています。収集の許諾が得られたタイトルについては、今後も定期的に収集・保存するとしています。

新着情報一覧(WARP)
http://warp.da.ndl.go.jp/contents/news/index.html
※2019年10月1日の新着情報に「2019年10月の特集「ブログ」を掲載しました」とあります。

E2177 - 米・アイビー・プラス図書館連合のQueer Japan Web Archive

2019年5月,米国の13の大学図書館で構成されるアイビー・プラス図書館連合(Ivy Plus Libraries Confederation;以下「Ivy Plus」)は,日本の性的マイノリティ(以下「LGBTQ」)に関するウェブサイトを収集保存するプロジェクト,Queer Japan Web Archive(以下「QJWA」)を発足させた。

ウェブアーカイブツールWebrecorderが新機能“Autopilot”を公開:特定サイトのキャプチャを自動化

ウェブアーカイブツールWebrecorderの2019年8月14日付けブログ記事において、技術的に複雑なウェブサイトのキャプチャを自動化する新機能“Autopilot”の公開が発表されています。

現在、FacebookやTwitterのタイムライン、InstagramのユーザーアカウントやYoutubeなど、特定のウェブサイトについては、キャプチャ時にそれらのウェブサイト用にカスタマイズされた自動アクションを利用できます。記事中では、今後対応するウェブサイトを増やしていく考えが示されています。

それら以外のウェブサイトでも機能は利用できるものの、現時点では、ページのスクロール及びページに埋め込まれた動画・音声の再生を含む、任意のページで機能するより一般的なアクションを行うとあります。

Introducing Webrecorder Autopilot(Webrecorder Blog, 2019/8/14)
https://blog.webrecorder.io/2019/08/14/autopilot

英国国立公文書館(TNA)、EUR-Lexから英国関連の文書とデータを抜き出して保存する“EU Exit Web Archive”を公開

2019年7月3日、英国国立公文書館(TNA)が、“EU Exit Web Archive”の公開を発表しています。

EU離脱準備における法的確実性と調査の支援を目的としており、同日付でEU離脱担当政務次官が議会に提出した声明文書によると、“EU Exit Web Archive”は、EU法の公式情報源であるEUR-Lexから英国関連の文書とデータを引き出したものです。離脱の日まで更新が行われ、離脱後は、EU離脱についての関連するEU文書の永久的な歴史的記録としての機能を果たすと説明されています。

また、国民が、EU離脱後にも適用される法を探すことができるように、TNAの法令検索・閲覧ウェブサイト“legislation.gov.uk”に関連するEU法を追加したこともあわせて発表されています。

@UkNatArchives(Twitter,2019/7/3)
https://twitter.com/UkNatArchives/status/1146423729406263296

E2151 - 2019年CEAL及びAAS年次大会・NCC公開会議<報告>

2019年3月,米国コロラド州デンバーにおいて,東亜図書館協会(CEAL)年次大会と北米日本研究資料調整協議会(NCC)公開会議が19日から21日にかけて,アジア学会(AAS)の年次大会が21日から24日にかけて開催された(E2028ほか参照)。国立国会図書館(NDL)からは,筆者を含む2人の職員が参加した。

米・アイビー・プラス図書館連合、欧州とユーラシアの作家・翻訳者・批評家・出版者に関するウェブコンテンツを収集したウェブアーカイブを公開

2019年6月19日、米・コロンビア大学図書館が、欧州とユーラシアの作家・翻訳者・批評家・出版者に関するウェブコンテンツを収集したウェブアーカイブ“Literary Authors from Europe and Eurasia Web Archive”の公開を発表しています。

重要な文学者や組織による非印刷物による出版活動のような現代文学の一連の行為の歴史を保存することを目的に、アイビー・プラス図書館連合(Ivy Plus Libraries Confederation)の支援を受け、ハーバード大学・プリンストン大学・コロンビア大学・イェール大学の図書館員により構築・運営されているものです。

Internet Archive(IA)、欧州の少数言語の機械翻訳進展のため、英・エジンバラ大学にウェブアーカイブの一部を提供

2019年6月19日、Internet Archive(IA)が、特にリソースが不足している言語の機械翻訳を進展させるためのオープンデータとツール構築のため、英国のエジンバラ大学にウェブアーカイブの一部を提供すると発表しています。

エジンバラ大学は、EUのインフラプロジェクトを支援する「コネクティング・ヨーロッパ・ファシリティ」からの助成を受け、他の大学と共同で、29の言語を対象として、ウェブから翻訳されたテキストをマイニングするプロジェクト“ParaCrawl”を行っています。

今回、IAが収集したウェブアーカイブを“ParaCrawl”プロジェクトに追加することで、マイニング対象となるアーカイブデータが増えることになります。IAでは、アイスランド語・クロアチア語・ノルウェー語・アイルランド語といった翻訳されたテキストが少ない言語を、内部的な分類ツールを用いてIAの通常のウェブアーカイブの中から抽出します。

オーストラリア国立図書館(NLA)、2019年オーストラリア総選挙の選挙運動で用いられたエフェメラ類の寄贈を呼びかけ中

オーストラリア国立図書館(NLA)が、2019年5月に実施されたオーストラリアの総選挙の選挙運動で用いられた、フライヤー・政策声明・投票ガイド・風船・横断幕・ポスター等といったエフェメラ類(オリジナル)の寄贈を呼びかけています。

特に健康サービス・労使関係・教育・鉱業・気候変動が懸念事項となっている、僅差で争われた選挙区・コミュニティにおける者に関心があり、また、首都圏だけでなく、地方の資料も収集したいとしています。

オンラインの選挙運動資料については、 同館のウェブアーカイブPandoraで収集されており、政党・候補者・圧力団体などといった約1,000のサイトが収集されています。

@nlagovau(Twitter,2019/6/18)
https://twitter.com/nlagovau/status/1141117937371111425

米・マサチューセッツ工科大学(MIT)図書館、MIT及びMIT関連のウェブアーカイブコレクションを公開

2019年6月3日、米・マサチューセッツ工科大学(MIT)図書館は、MITが作成、もしくは、MITと関連するウェブサイトのウェブアーカイブコレクションの公開を発表しました。

MITの研究所やグループ、または、それらと関係する個人の価値ある情報を長期的に利用できるように収集・保存されたもので、Archive-Itのウェブサイトから閲覧することができます。同事業は、Archive-Itを用いて2016年から開始され、現在61ページが収集されており、今後も対象を増やす計画です。

Distinctive Collections opens web archives to the public Archived MIT-produced and affiliated webpages ensure valuable information about the Institute remains accessible(MIT Libraries,2019/6/3)
https://libraries.mit.edu/news/distinctive-collections/29709/

ページ