Technischer Hintergrund zur Umsetzung der LOR-Seiten

Gleich zum Start meines Blogs, das erste 4 Sterne Menü: Die neuen LOR-Seiten. Auf den neuen LOR-Seiten finden sich anonymisierte Zahlen¹ zum Migrationshintergrund, zur Staatsangehörigkeit und zur Altersverteilung aller Bewohner eines beliebigen Sozialraums in Berlin. Die Infos können von Besucherinnen und Besuchern zum Beispiel zur argumentativen, sachlichen Stütze von Förderanträgen im Bereich der sozialraumorientierten Stadtentwicklung genutzt werden. LORs ist die Bezeichnung mancher StadtplanerInnen für die kleinste städtische Planungseinheit in Berlin. Diese umfasst so, je nach Häuserdichte der Region, circa 1 000 bis 25 000 beim Einwohneramt registrierte Berliner. Das ist schon ziemlich fein und somit gibt es jetzt für alle (an das Internet angeschlossene ErdbewohnerInnen) eine übersichtliche, statistische Perspektive auf die eigene oder noch fremde Berliner Nachbarschaft.

Das erste Ziel war dabei die fachlich bewährte Auswertung die MitarbeiterInnen der Gesellschaft für sozial-kulturelle Arbeit bisher in die PDFs steckten, in ein Skript zu überführen welches die Auswertung in Zukunft automatisch, also ohne aufwendige Handarbeit einzelner Personen, sowie zeitnah zur Veröffentlichung der allerneuesten Daten, allen ermöglicht. Auf dem Weg dahin konnten wir die Einwohnerstatistik der Stadt Berlin auch noch mit einem interaktiven Stadtplan verbinden, in der Überzeugung so die Daten für jede/n besser zugänglich zu machen. Das ist als Hilfe gedacht für BewohnerInnen, JournalistInnen oder sozial engagierte Menschen, etwa bei der Beantragung von Fördermitteln, beim Schreiben von Artikeln oder einfach zum besseren Kennenlernen der eigenen Nachbarschaft.

Auf Seite 2 berichte ich im Detail über die technische Umsetzung der neuen LOR-Seiten. Vielleicht gibt es ja ein paar interessierte Daten-Journalisten oder Programmier-Anfänger die sich für diese Arbeit und einen evtl. Ausbau der Seiten interessieren.

Als Beispiel für eine LOR-Seite in Aktion gibt’s hier einen Link zu einem Raum in dem sich wohl zu allen Fällen des stadtplanerischen Dialogs gute und schlechte Antworten finden lassen, dem Reuterkiez. Mehr zu den technischen Grundlagen, nach dem Klick.

Klick.

In Zusammenarbeit mit der GskA Berlin mbH konnte ich erstmals am 8.Dezember (zum 9. Kiezatlas NutzerInnen-Treffen) 480 kleine Webseiten vorstellen die seitdem jeder Interessent über diese Startseite ansteuern kann. Meine Arbeit umfasste dabei die Zusammenführung von 5 verschiedenen, halbjährlich in Form von strukturierten Text-Dateien, veröffentlichten Datenquellen sowie die Implementierung der statistischen und grafischen Aufbereitung der darin enthaltenen Zahlen. Die anonymisierten Einwohnerstatistiken werden bereits seit längerem halbjährlich vom Amt für Statistik Berlin-Brandenburg aufbereitet und sind wohl schon seit eh und je auf Anfrage dort erhältlich. Auf dem Weg zur Fertigstellung fand ich zufällig auch die geografischen Informationen zu den LORs in dem Web-Portal vom Amt für Statistik Berlin-Brandenburg. 5 plus 1 ergibt ja meist 6 und alle Datenquellen zusammengerechnet ein recht brauchbares Päckchen an Infos, wie ich denke. Die Infos dieser Seiten ziehen sich halbautomatisch, mittels Datei-Upload, aus den Daten des Amts für Statistik Berlin Brandenburg.

Eingesetzte Techniken 

Das Skript welches die 4 CSV-Dateien zusammenführt besteht aus ca. 800 Zeilen PHP-Code, Input für das Skript ist lediglich die LOR-Raum-ID und Output ist eine HTML-Seite die mit den JavaScript-Bibliotheken raphael.js (Diagramm zur Altersverteilung) und OpenLayers.js (Kartendarstellung) zur verbesserten Darstellung und Interaktivität serverseitig angereichert wird. Die gesamte Software ist mitsamt der eingesetzten Daten zur weiteren Verbreitung, Anpassung und Anschauungszwecken in einem versionierten Dateiarchiv auf github.com hinterlegt.

Beispiele für einzelne statistische Größen

Bei den Zahlen zum Migrationshintergrund und zur Staatsangehörigkeit werden die Prozentwerte einzelner Bevölkerungsgruppen errechnet und im Vergleich “Planungsraum <—> Gesamt-Berlin” dargestellt. Bereits bei der Erhebung dieser beiden Datensätze wurde die Auswahl hier auf einige Bevölkerungsgruppen beschränkt, darunter fällt z.B. auch die Gruppe der Menschen bei denen Herkunft oder Migrationshintergrund den Behörden Unbekannt ist.

Screenshot: Altersverteilung im Kiez Invalidenstraße
Screenshot 15.April 2013: Altersverteilung im Kiez Invalidenstraße

Bei der Aufbereitung einer aus unserer Sicht bedeutungsvollen Altersverteilung sind die Zahlen leicht verzogen, einfach weil die herausgegebenen Zahlen (Geburts-) Jahrgänge in unterschiedlich großen (Alters-) Gruppen zusammengefasst wurden. Wir haben, um vergleichbare Werte zu erhalten, die Prozentwerte in den unterschiedlichen Altersgruppen daher im Mittel auf die einzelnen Jahrgänge runter gebrochen. D.h. wenn die Altersgruppe 30-35, wie im Planungsraum der Invalidenstraße, 2087 Menschen von insg. 13743 Menschen beziffert, hat diese Altersgruppe einen Anteil von knapp 15% in dem Kiez. Um leichter vergleichbare Diagramme zu erhalten haben wir uns nun für den gemittelten Prozentwert (Prozentwert der Altersgruppe geteilt durch die Anzahl der darin enthaltenen Jahrgänge) entschieden, einfach um eine bessere visuelle Darstellung zu erhalten. Dieses Beispiel erklärt hoffentlich anschaulich den Prozentwert von 3% der Altersgruppe der 30-35 jährigen StadtbewohnerInnen im Kiez der Invalidenstraße.

Geografische Navigation zwischen einzelnen Sozialräumen

Screenshot: Geografischer Kontext des Planungsraums "Invalidenstraße"
Screenshot: Geografischer Kontext des Planungsraums “Invalidenstraße”

Um einen gezielten LOR in seiner Position im Stadtgebiet erfassen zu können mussten wir die zur Verfügung stehenden Daten noch ein wenig aufbereiten. Denn der original im KML-Format und unter der CC-BY 3.0 Lizenz veröffentlichten LOR-Geometrien fehlten die Raumnummern.

Die LOR-Geometrie kam dabei als 3.5 MegaByte große File mit einigen unnötigen Zusatzinformationen die in einem sog. CDATA-Blockelement¹ abgelegt waren bei mir an. Diesen CDATA-Block möchte ich an dieser Stelle jedem mehr oder weniger einfach mal als das Element vorstellen welches für “blöde, rohe Daten” steht. Außerdem waren in dieser Datei zwar die geografischen Flächen-Informationen eines Raums enthalten, nicht jedoch die eindeutige Nummer des Raums an geeigneter Stelle, was einer Nutzung der Geometrie zur Navigation zwischen den Seiten ja unmöglich machte.

Bereinigt um die unnützen Infos im CDATA-Blockelement jedes Elements ist die Datei nochmal um 1.3 MegaByte geschrumpft. Nun ausgestattet mit dem nötigsten, also den jew. LOR-Raumnummern als id=”” an den einzelnen (Achtung: KML-Slang) sog. “Placemark”-Elementen und dem Namen des Planungsraum. Mehr muss zu unserem Zwecke ja nicht über die Leitung geschickt werden. EntwicklerInnen LOR basierter Webanwendungen können sich die entschlackte Version dieser unter CC-BY 3.0 DE lizensierten LOR-Geometrie, jetzt erstmals mit Raumnummern, aus dem lor-pages Archiv bzw. unter diesem Direktlink, für Ihre Arbeit herunterladen.

Ein digitales Danke schön!

Die knapp 3 tägige, z.T sehr akribische aber spannende Arbeit an den LOR-Seiten hat jedenfalls richtig Spaß gemacht. Sobald die neuesten Datensätze (Dezember 2012) in die Anwendung eingespielt sind gibt’s die nächste News. Ein großer Hypertext-Dank geht natürlich an die GskA Berlin mbH die mir bei der Umsetzung der Seiten mit Ihrer Expertise zur Seite stand und diese Arbeiten letztendlich auch finanzieren konnte.

Fußnoten

¹ Das in sich unstrukurierte CDATA-Blockelement der LOR-Geometrie enthält noch mehr Infos je Planungsraum, namentlich Fläche in HA, IBR, Koordinationhinweis (WGS 84 Auxiliary Sphere) und eine FID.

² anonymisierte Zahlen heißt z.B. das in Planungsräumen mit ganz wenigen Einwohnern evtl. keine Statistiken veröffentlicht werden können da diese Rückschlüsse auf die Herkunft oder das genaue Alter einzelner BewohnerInnen des Gebiets zulassen würden.

Hinweis: In der Migrationstabelle sind mit EU-15 Belgien, Estland, Irland, Italien, Luxemburg, Niederlande, Deutschland, Finnland, Frankreich, Österreich, Portugal (11) + Griechenland (12) + Slowenien (13) + Zypern + Malta (EU-15) gemeint, das fand ich zumindest über das Studium dieser Seite heraus.