検索エンジン

東京大学附属図書館、電子展示『捃拾帖』に「貼り込み資料画像検索プロトタイプ」機能を試験追加

2019年2月4日、東京大学附属図書館は、2019年1月15日に公開した電子展示『捃拾帖』(くんしゅうじょう)に「貼り込み資料画像検索プロトタイプ」機能を試験追加したと発表しました。

同館が公開する「田中芳男・博物学コレクション」と、国立国会図書館デジタルコレクションで公開されている『張交帖』を対象とした画像検索システムです。

「貼り込み資料画像検索プロトタイプ」のウェブサイトでは、貼り込まれた資料単位での画像検索が可能であること、2019年1月末時点において、99帖、13,069コマ、34,746件の貼り込み資料が検索対象となっていること、画像の閲覧ビューアとして人文学オープンデータ共同利用センターが開発した IIIF Curation Viewerを利用していること等が紹介されています。

なお、同システムはプロトタイプの段階であり、データや機能なども予告なく変更される可能性があるとしています。

LIS Newsが選ぶ2018年の図書館・図書館情報学関連の10大ニュース(米国)

2018年12月14日、図書館や図書館情報学に関するニュースを掲載している米国のブログLIS Newsが、同ブログが選ぶ2018年の10大ニュースを発表しています。

1. LGBTやドラァグクイーンに関する図書館の展示・蔵書・プログラムへの異議申し立て

2. データ侵害がプライバシー問題を刺激
※ケンブリッジ・アナリティカ社

3. 複数館で図書館の資料延滞者への罰金廃止

4. オープンアクセス(OA)の行方

5. 虚偽の、もしくは、不審な内容の論文に関するスキャンダル

6. 法律に関する問題(アバンダンウェアとフェアユース・米ジョージア州立大学の電子リザーブ訴訟・マラケシュ条約・米国著作権局の米国議会図書館(LC)からの移管等)

7. 刑務所での禁書

8. サーチエンジンは偏っている
※“Algorithms of Oppression”(抑圧のアルゴリズム)の出版

9. フェイクニュースの拡大

10. オピオイドの蔓延が継続

Google、“Dataset Search”(ベータ版)を公開

2018年9月5日、Googleが“Dataset Search”(ベータ版)の公開を発表しています。

出版者や個人ウェブサイト、デジタルライブラリ、データリポジトリ等で公開されている多様なデータセットを検索する事が可能です。

Googleでは、“Dataset Search”を開発するに当たり、Google等の検索エンジンが、データセットの作成者・公開日・収集方法・使用条件などを理解できるよう、標準schema.orgに基づいたデータ記述方法のガイドを作成しており、研究データのプロバイダに対して、同標準を採用することを推奨しています。

Making it easier to discover datasets(Google,2018/9/5)
https://www.blog.google/products/search/making-it-easier-discover-datasets/

人文学オープンデータ共同利用センター(CODH)、「IIIF Curation Finder」「IIIF Curation Platform」「顔貌コレクション(顔コレ)」を公開

2018年5月23日、人文学オープンデータ共同利用センター(CODH)が、「IIIF Curation Finder」「IIIF Curation Platform」「顔貌コレクション(顔コレ)」を公開しました。

「IIIF Curation Finder」は、「IIIF Curation Viewer」で作成したキュレーションを検索可能にするとともに、検索結果を再編集した新たなキュレーションも公開可能としたものです。

「IIIF Curation Platform」は、IIIFの世界における有力な検索エンジンの不在という課題に対応するために、JSONkeeperやCanvas IndexerなどのソフトウェアをAPIで接続することで、IIIF検索エンジンのプロトタイプとして作成されたものです。

「顔貌コレクション」は、「IIIF Curation Platform」を活用したもので、美術作品に出現する顔の部分を切り取って集め、それを美術史研究(特に様式研究)に活用するプロジェクトです。顔の描き方を比較検討することで、例えば絵師や工房の異同を推定したり、影響関係を見出したりすることが可能になるとしています。

Google社、自然言語処理研究のデモとして、文章を入力すると書籍内の適切な一節を表示する“Talk to Books”を公開

2018年4月13日、Google社が、自然言語処理研究のデモとして、“Talk to Books”を公開しました。

“Talk to Books”は、文章レベルで書籍を検索できるツールで、実装にあたっては、10億もの会話に基づいた機械学習が行われています。

文章や質問を入力すると、キーワードマッチングによる手法ではなく、Google Books内の10万冊を超す書籍の中から意味的に近い一節を見つけ出して表示します。

機械学習に基づいた単語の連想ゲーム“Semantris”等も併せて公開されています。

Introducing Semantic Experiences with Talk to Books and Semantris(Google Research Blog,2018/4/13)
https://research.googleblog.com/2018/04/introducing-semantic-experiences-with.html

オープンソースのデータリポジトリ“Dataverse”、Schema.orgに対応

2017年12月6日、オープンソースのデータリポジトリ“Dataverse”を開発する“Dataverse Project”が“Dataverse 4.8.4”を公開し、“Schema.org”に対応したと発表しています。

2017年夏、同プロジェクトでは、研究データのウェブ上での発見可能性向上や文献管理ツールへのメタデータのエクスポートに対応するために“Dublin Core”を採用しましたが、FORCE11の「学術データリポジトリのデータ引用ロードマップ」での“Dublin Core”“Schema.org”両者の採用という推奨事項に対応するため、今回の実装となりました。

今回、“Dataverse”のいくつかのメタデータ要素を“Schema.org”にマッピングすることを延期しているため、今後のリリースでこれらの要素に対応する計画です。

Dataverse Project
https://dataverse.org/
※「Dataverse 4.8.4 release adds support for Schema.org December 6, 2017」とあります。

“Mendeley Data”、Googleのデータセット用のマークアップ標準を採用

2017年5月23日付けのMendeleyのブログが、研究データリポジトリ“Mendeley Data”が、Googleのデータセットのためのマークアップ標準(markup standard)を採用したと発表しています。

Googleの検索エンジンが認識する構造化された方法で“Mendeley Data”搭載のデータセットについて記述することで、その発見可能性を高め、検索結果から簡単にデータセットを利用できるようにすることを目的としています。

Mendeley Data adopts Google Science Datasets standards(
Mendeley Blog,2017/5/23)
https://blog.mendeley.com/2017/05/23/mendeley-data-adopts-google-science-datasets-standards/

「Googleの著作権侵害対策」のレポート(Google公共政策部の“How Google Fights Piracy”の日本語訳)が公開

2016年9月12日、Google公共政策部は、「Googleの著作権侵害対策」というタイトルのレポートを発表しました。

この報告書は、Googleが2016年7月13日に公開したレポート“How Google Fights Piracy”の日本語訳となっています。

・イントロダクション
・業界の状況とオンラインイノベーション
・数字で見る著作権
・YouTube
・Google のウェブ検索
・Google Play
・広告
・結論

の各章で構成され、Googleによる著作権管理等、著作権侵害に対する取組みのほか、コンテンツを管理することによって、GoogleやYouTubeを活用し、多くの収益がもたらされていることも、事例とともに紹介されています。

「Googleの著作権侵害対策」
https://drive.google.com/file/d/0B_gwgQKfOXicZ0lWcl83LURNY2c/view

Google の著作権侵害対策 日本語版リリース(Google Japan Blog)
https://japan.googleblog.com/2016/09/google.html

Elsevier社が研究データの検索ツール”DataSearch”ベータ版を公開

Elsevier社が新たに研究データの検索ツール、”DataSearch”のベータ版を公開しています。

同ツールは複数のデータリポジトリ等に収録された研究データを横断して検索できるシステムです。公開された生データ等を検索できるほか、論文中に含まれる図表等についても該当部分のみを抜き出して、検索結果画面上で閲覧することができます。また、データの種類や公開元リポジトリ、日付による検索結果の絞り込みが実装されています。

DataSearchは現在も開発継続中のツールであり、システム改善に向けて利用者からの意見等も受け付けているとのことです。

Introducing Elsevier DataSearch(Mendeley Blog、2016/8/24付け)
https://blog.mendeley.com/2016/08/24/introducing-elsevier-datasearch/

「あのひと検索SPYSEE2」公開

2016年8月17日、株式会社オーマが、ウェブ上の情報から人物間のつながり等を可視化する検索エンジン、「あのひと検索SPYSEE2」を公開しました。2008年に公開された「あのひと検索SPYSEE」の新バージョンです。

同サービスでは著名人の氏名等で検索すると、その人物と関係する人物の相関図や、プロフィール、関連キーワード等を閲覧することができます。インターネット上での共起関係に基づく独自アルゴリズムに、機械学習・人工知能技術を加えて、人物同士のつながりの強さや人物とキーワードのつながりの強さを算出しているとのことです。

あのひと検索SPYSEE2
http://spysee2.jp/

有名人の人間関係が丸分かり!? AI搭載の人物検索「あのひと検索SPYSEE2」公開(ITmediaニュース、2016/8/17付け)
http://www.itmedia.co.jp/news/articles/1608/17/news065.html

ページ