ウェブアーカイブ

ウェブアーカイブツールWebrecorderが新機能“Autopilot”を公開:特定サイトのキャプチャを自動化

ウェブアーカイブツールWebrecorderの2019年8月14日付けブログ記事において、技術的に複雑なウェブサイトのキャプチャを自動化する新機能“Autopilot”の公開が発表されています。

現在、FacebookやTwitterのタイムライン、InstagramのユーザーアカウントやYoutubeなど、特定のウェブサイトについては、キャプチャ時にそれらのウェブサイト用にカスタマイズされた自動アクションを利用できます。記事中では、今後対応するウェブサイトを増やしていく考えが示されています。

それら以外のウェブサイトでも機能は利用できるものの、現時点では、ページのスクロール及びページに埋め込まれた動画・音声の再生を含む、任意のページで機能するより一般的なアクションを行うとあります。

Introducing Webrecorder Autopilot(Webrecorder Blog, 2019/8/14)
https://blog.webrecorder.io/2019/08/14/autopilot

英国国立公文書館(TNA)、EUR-Lexから英国関連の文書とデータを抜き出して保存する“EU Exit Web Archive”を公開

2019年7月3日、英国国立公文書館(TNA)が、“EU Exit Web Archive”の公開を発表しています。

EU離脱準備における法的確実性と調査の支援を目的としており、同日付でEU離脱担当政務次官が議会に提出した声明文書によると、“EU Exit Web Archive”は、EU法の公式情報源であるEUR-Lexから英国関連の文書とデータを引き出したものです。離脱の日まで更新が行われ、離脱後は、EU離脱についての関連するEU文書の永久的な歴史的記録としての機能を果たすと説明されています。

また、国民が、EU離脱後にも適用される法を探すことができるように、TNAの法令検索・閲覧ウェブサイト“legislation.gov.uk”に関連するEU法を追加したこともあわせて発表されています。

@UkNatArchives(Twitter,2019/7/3)
https://twitter.com/UkNatArchives/status/1146423729406263296

E2151 - 2019年CEAL及びAAS年次大会・NCC公開会議<報告>

2019年3月,米国コロラド州デンバーにおいて,東亜図書館協会(CEAL)年次大会と北米日本研究資料調整協議会(NCC)公開会議が19日から21日にかけて,アジア学会(AAS)の年次大会が21日から24日にかけて開催された(E2028ほか参照)。国立国会図書館(NDL)からは,筆者を含む2人の職員が参加した。

米・アイビー・プラス図書館連合、欧州とユーラシアの作家・翻訳者・批評家・出版者に関するウェブコンテンツを収集したウェブアーカイブを公開

2019年6月19日、米・コロンビア大学図書館が、欧州とユーラシアの作家・翻訳者・批評家・出版者に関するウェブコンテンツを収集したウェブアーカイブ“Literary Authors from Europe and Eurasia Web Archive”の公開を発表しています。

重要な文学者や組織による非印刷物による出版活動のような現代文学の一連の行為の歴史を保存することを目的に、アイビー・プラス図書館連合(Ivy Plus Libraries Confederation)の支援を受け、ハーバード大学・プリンストン大学・コロンビア大学・イェール大学の図書館員により構築・運営されているものです。

Internet Archive(IA)、欧州の少数言語の機械翻訳進展のため、英・エジンバラ大学にウェブアーカイブの一部を提供

2019年6月19日、Internet Archive(IA)が、特にリソースが不足している言語の機械翻訳を進展させるためのオープンデータとツール構築のため、英国のエジンバラ大学にウェブアーカイブの一部を提供すると発表しています。

エジンバラ大学は、EUのインフラプロジェクトを支援する「コネクティング・ヨーロッパ・ファシリティ」からの助成を受け、他の大学と共同で、29の言語を対象として、ウェブから翻訳されたテキストをマイニングするプロジェクト“ParaCrawl”を行っています。

今回、IAが収集したウェブアーカイブを“ParaCrawl”プロジェクトに追加することで、マイニング対象となるアーカイブデータが増えることになります。IAでは、アイスランド語・クロアチア語・ノルウェー語・アイルランド語といった翻訳されたテキストが少ない言語を、内部的な分類ツールを用いてIAの通常のウェブアーカイブの中から抽出します。

オーストラリア国立図書館(NLA)、2019年オーストラリア総選挙の選挙運動で用いられたエフェメラ類の寄贈を呼びかけ中

オーストラリア国立図書館(NLA)が、2019年5月に実施されたオーストラリアの総選挙の選挙運動で用いられた、フライヤー・政策声明・投票ガイド・風船・横断幕・ポスター等といったエフェメラ類(オリジナル)の寄贈を呼びかけています。

特に健康サービス・労使関係・教育・鉱業・気候変動が懸念事項となっている、僅差で争われた選挙区・コミュニティにおける者に関心があり、また、首都圏だけでなく、地方の資料も収集したいとしています。

オンラインの選挙運動資料については、 同館のウェブアーカイブPandoraで収集されており、政党・候補者・圧力団体などといった約1,000のサイトが収集されています。

@nlagovau(Twitter,2019/6/18)
https://twitter.com/nlagovau/status/1141117937371111425

米・マサチューセッツ工科大学(MIT)図書館、MIT及びMIT関連のウェブアーカイブコレクションを公開

2019年6月3日、米・マサチューセッツ工科大学(MIT)図書館は、MITが作成、もしくは、MITと関連するウェブサイトのウェブアーカイブコレクションの公開を発表しました。

MITの研究所やグループ、または、それらと関係する個人の価値ある情報を長期的に利用できるように収集・保存されたもので、Archive-Itのウェブサイトから閲覧することができます。同事業は、Archive-Itを用いて2016年から開始され、現在61ページが収集されており、今後も対象を増やす計画です。

Distinctive Collections opens web archives to the public Archived MIT-produced and affiliated webpages ensure valuable information about the Institute remains accessible(MIT Libraries,2019/6/3)
https://libraries.mit.edu/news/distinctive-collections/29709/

FIFA女子ワールドカップ2019と“UK Web Archive”:収集するウェブコンテンツを募集(記事紹介)

2019年6月7日から7月7日にかけてフランスで行われる「FIFA女子ワールドカップ2019」にちなみ、英国図書館(BL)等が運営しているウェブアーカイブ“UK Web Archive”のブログ(2019年5月28日付)が、FIFA女子ワールドカップと“UK Web Archive”に関する記事を投稿しています。

伝統的に女子スポーツがメディアで取り上げられることは少なかったが、近年は変化が見られ、“UK Web Archive”で収集されたデータを分析した結果では、FIFA女子ワールドカップ関連情報が1999年には11件であったのが、2007年・2011年と英国代表が参加した後の2011年の収集データでは4,930件へと増加していること等が指摘されています。

一方で、“UK Web Archive”のコレクションでは性別による区別は行われていないが、マスコミを含む社会の男女平等の欠如により男女のバランスが崩れていることも指摘し、言語を問わず、英国で発信されたFIFA女子ワールドカップ2019関連のウェブページを発見した場合、公募フォームから知らせるよう依頼しています。

アイビー・プラス図書館連合(Ivy Plus Libraries Confederation)、日本のLGBTQに関するウェブサイトを収集した“Queer Japan Web Archive”を公開(米国)

日本のLGBTQに関するウェブサイトを収集した“Queer Japan Web Archive”の公開が発表されています。

同アーカイブは、アイビー・プラス図書館連合(Ivy Plus Libraries Confederation)のもと、ブラウン大学、デューク大学、ハーバード大学、プリンストン大学、イェール大学の日本研究司書の共同事業として、柳原良江氏(東京電機大学)・志田哲之氏(早稲田大学)による学術的支援を受けて運営されています。

日本の非営利団体によりLGBTQコミュニティの研究・権利擁護・支援・サービス提供を目的として作成されたウェブサイトの収集・保存が目的です。

収集対象には、非営利団体が行っているLGBTQコミュニティの支援サービスにより提供されている、生活の質向上、不動産、雇用、教育援助、ヘルプライン、ワークショップ、メンタルヘルス、HIV / AIDSのような性感染症、法律関係の情報が含まれます。

同事業では、収集対象となるウェブサイトの推薦を受け付けています。

アイビー・プラス図書館連合(Ivy Plus Libraries Confederation)、東欧及び旧ソビエト連邦地域のウェブサイトを収集したウェブアーカイブを公開(米国)

2019年5月7日、米・コロンビア大学図書館が、東欧及び旧ソビエト連邦地域のコンテンツを収集したウェブアーカイブ“Eastern Europe and Former Soviet Union Web Archive”の公開を発表しています。

同アーカイブは、アイビー・プラス図書館連合(Ivy Plus Libraries Confederation)のもと、コロンビア大学・プリンストン大学・イェール大学・ニューヨーク大学・ニューヨーク公共図書館(NYPL)が連携し、ブラウン大学・シカゴ大学・コーネル大学・ダートマス大学・デューク大学・ハーバード大学・ジョンズホプキンズ大学・ペンシルバニア大学と共同で構築されたものです。

近年、同地域において、現在及び将来における人文学・社会科学・歴史学のプロジェクトにとって価値があると思われる多くの重要なウェブサイトが生み出されていることから、それらを収集・保存するために実施されました。

収集対象には、政党、非政府組織、活動家グループ、芸術・文化団体、歴史学者・哲学者等のウェブサイトが含まれています。

ページ