OpenRefine

OpenRefine
開発元 Freebase。後にGoogle。現在はオープンソースコミュニティ
初版 2010年11月10日 (14年前) (2010-11-10)
最新版
3.9.0[1] ウィキデータを編集 / 2025年2月13日 (13日前)
リポジトリ ウィキデータを編集
プログラミング
言語
Java[2]
プラットフォーム Microsoft Windows, Linux, macOS
対応言語 英語、イタリア語、中国語、日本語、フランス語
サポート状況 Active
種別
ライセンス BSD License
公式サイト openrefine.org
テンプレートを表示

OpenRefine(旧称:Google Refine、さらに以前はFreebase Gridworks)は、スタンドアローンでオープンソースデスクトップアプリケーションで、データのクリーンナップ、他の形式への変換、データラングリングと呼ばれる処理を行うことができる[3]。見た目はスプレッドシートアプリケーションに似ているが(スプレッドシートファイル形式も処理できる)、よりデータベースに近い動作をする。

各列(カラム)の下にセルを持つデータの各行に対して様々な操作を行う。これは、リレーショナルデータベースのテーブルに非常によく似ている。1つのOpenRefineプロジェクトは1つのテーブルからなる。ユーザーは、ファセット(facet)と呼ばれるフィルタリング条件(例えば、指定した列が空でない行のみを表示するなど)の定義を使用して、表示する行をフィルタすることができる。スプレッドシートとは違い、OpenRefineのほとんどの操作は、表示された行全体に対して実行される。たとえば、1つのカラムの下にある全ての行のすべてのセルに対して変換処理が適用されたり[4]、すでにあるカラムを元にして新しいカラムが作成されるといった処理となる。すべての操作はプロジェクト内に保存された1つのデータセットに対して実行され、別のデータセットに対して同じ操作を繰り返し適用することができる。

スプレッドシートとは異なり、セルの中には数式は保存されず、数式はデータの変換に使われ、また、データの変換は1回のみ実行される[5]。データを変換する処理式はGeneral Refine Expression Language (GREL)[6]と呼ばれるDSLの他、Jython(つまりPython)やClojureで記述することも可能である[7]

プログラムにはウェブユーザーインターフェイスが組み込まれているが、ウェブサービス(SaaS)としてホストされるわけではなく、ダウンロード後にローカルマシンで動作するためのものである。OpenRefineを実行すると、ローカルでウェブサーバが起動し、このウェブサーバ上で動作するウェブUIがブラウザで自動的に開かれる。

  1. ^ "Release 3.9.0"; 閲覧日: 2025年2月25日; 出版日: 2025年2月13日.
  2. ^ OpenRefine/OpenRefine - GitHub”. 25 June 2017閲覧。
  3. ^ OpenRefine Project Home”. 2018年10月5日閲覧。
  4. ^ Editing by transforming: Cell Editing wiki page from Refine documentation”. 18 April 2012閲覧。
  5. ^ Comparison with spreadsheet software: Cell Editing wiki page in Refine documentation”. 18 April 2012閲覧。
  6. ^ General Refine expression language OpenRefine/OpenRefine Wiki GitHub. Github.com (2013-04-03). Retrieved on 2013-08-16.
  7. ^ Expressions: Refine documentation”. 18 April 2012閲覧。

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne