Skip to content

Such Regex für Graph Search

repat edited this page Dec 14, 2014 · 24 revisions

Update: Diese Liste ist nur ein grober Überblick, die eigentlichen Regex Ausdrücke sind in browser.js definiert

Das ist eine Liste zum greppen von Ausdrücken, die Facebook in den <div> Elementen zurückgibt. Zum Basteln eignet sich vor allem regex101.com im Javascript Modus.

Das gesuchte Attribut ist immer x. \s ist ein Leerzeichen. ^ ist (hier) die Negierung.

JSON Attribut Regex Beispiel
age x[\s]years[\s]old 23 years old
gender female[^s] female [1]
gender male[^s] male [1]
profession x[\s]at[\s]y Mechanic at Workshop
profession Works[\s]at[\s]x Works at Lockheed
employer a[\s]at[\s]x Scientist at Umbrella
lives Lives[\s]in[\s]x Lives in Vancouver
from From[\s]x From Seattle
university Went[\s]to[\s]x Went to Woodlawn Highschool
university Studies[\s]at[\s]x Studies at MIT [2]
university Studied[\s]at[\s]x Studied at Havard [2]
university Studies[\s]y[\s]at[\s]x Studies Computer Science at Stanford [2]
university Studied[\s]y[\s]at[\s]x Studied Literature at Cambridge [2]
relationship Single Single
relationship In[\s]a[\s]relationship[*] In a relationship [3]
languages Speaks\sx Speaks English, French and 3 other languages

[1] female s bzw. male s befindet sich im String Interested in {males|females}. Das brauchen wir nicht.

[2] Vergangenheitsform: studie d (nicht Präsens studie s)

[3] Bei Beziehungen könnte immer noch with John/Jane Doe angehängt sein, deswegen das [*] zur Verdeutlichung. Alle relationships finden sich in den Rückgabeformat

Javascript

regexArray = [
              ['gender',/(female)(?!s)/gmi],
              ['gender',/\s(male)(?!s)/gmi],
              ['age', /(\d)years\sold/i],
              ['lives',/Lives\sin\s(.*)/i],
              ['from',/.*From\s(.*)/i],
              ['university',/(?=Studie[s|d]).*at\s(.*)/gmi],
              ['employer',/^(?!Studie[s|d]).*\sat(.*)/gmi],
              ['studies',/(?=Studie[s|d]\s)Studie[s|d]\s(.*)\sat.*/gmi],
              ['relationship',/(Single)/i],
              ['relationship',/(In\sa\srelationship).*/i],
              ['relationship',/(Open\srelationship).*/i],
              ['relationship',/(Engaged).*/i],
              ['relationship',/(Widowed).*/i],
              ['relationship',/(Civil Union).*/i],
              ['relationship',/(Complicated).*/i],
              ['relationship',/(Divorced).*/i],
              ['relationship',/(Dating).*/i],
              ['relationship',/(Seperated).*/i],
              ['language',/Speaks\s(.*)/i]
            ]