Google Refine: Nützlicher Helfer zur Bearbeitung von Datensätzen

Google Refine ist ein neues, sehr interessantes Tool von Google. Es dient dazu, Datensätze zu bearbeiten, aufzuräumen oder umzuwandeln. Insofern also auch für Flash-Entwickler nützlich, wenn man z.B. mit XML-, JSON- oder CSV-Dateien hantieren muss.

Google umschreibt Refine so: „A power tool for working with messy data.”.

Der ersten Eindruck von Google Refine erinnert an eine Tabellenverarbeitung im Stil von Excel. Man kann Daten in verschiedenen Formaten importieren und bekommt eine Listendarstellung. Allerdings ist die Arbeitsweise etwas anders.

Facets

Eine Möglichkeit besteht, die Inhalte zu filtern (so genannte Facets). Über Text Facets können z.B. Spalten mit Textinhalten gefiltertert werden. In einer Box sieht man dann aufgelistet, wie viele Zeilen zu jeweiligen Wert existieren (links im Screenshot). Lässt man sich diese Datensätze anzeigen, kann man genaue diese Zeilen gezielt manipuliert.

Außerdem gibt es verschiedene andere Facets, wie z.B. Number Facet (rechts im Screenshot). Interessant ist des Weiteren, dass man auch mehrere Facets gleichzeitig anwenden kann, um die Datensätze weiter eingrenzen zu können.

Daten transformieren

Über die zahlreiche weitere Funktionen lassen sich im Prinzip alle vorstellbaren Operationen ausführen: Spalten auftrennen, Regular Expression oder sogar das Abrufen von Daten anhand von URLs, um nur einige Beispiele zu nennen. Über eine spezielle Programmiersyntax namens GREL (Google Refine Expression Language) können die Inhalte ebenfalls transformiert werden.

Google Refine ist Open Source. Man muss übrigens keine sensiblen Daten zu Google hochladen, da das Programm lokal arbeit.

Link: Google Refine

[ad]

Ein Gedanke zu „Google Refine: Nützlicher Helfer zur Bearbeitung von Datensätzen“

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert