Ich denke, es stört dich nicht wenn diese 2 Smileys nicht mitzählenJap.<img>
darf gar kein</img>
haben. Das wird bs4 verwirren und alles kaputt machen. Du kannst das aber in Text umformen</img>
heraus filtern und dann wieder als soup einlesen.
Irgendwo anderes gab es aber auch irgend ein interessanten Effekt mit smileys...
Deine letzte Aufgabe habe ich absolviert und do hast sie nicht mal ausprobiert.Cer66 ich habe eine Aufgabe für dich: Programmiere für mich einen Prototypen vom Spiel Pumuckl fangt den Klabauter.
raw author content like_count quote_count ... emoji_count emoji_frequency_mapping is_edited is_rules_compliant rulebreak_reasons
0 <article class="message message-threadStarterP... IceCubiee Nun ich wollte mal heute wieder ganz lieb und ... 16 8 ... 9 {':p': 2, ':D': 1, ';)': 3, '^^': 3} True True []
1 <article class="message message--post js-post ... artfigure Warum sollte die letzte Antwort bitte 32 Dias ... 0 0 ... 1 {':D': 1} False False [punctuation]
2 <article class="message message--post js-post ... Gingernils Das ist der Sinn des Forenspiels: Einfach nur ... 0 0 ... 0 {} False True []
3 <article class="message message--post js-post ... derschneck_ Mensch ist das fies, sobald man hier was schre... 5 0 ... 1 {';)': 1} False True []
4 <article class="message message--post js-post ... CreeperGirl2401 Hiermit schreibe ich auch mal was und bitte di... 0 0 ... 1 {':p': 1} False False [punctuation]
... ... ... ... ... ... ... ... ... ... ... ...
14421 <article class="message message--post js-post ... Cer66 @fscriptMir fällt grad ein, dass ich dir die B... 0 0 ... 0 {} False True []
14422 <article class="message message--post js-post ... maua1 Gib aber bitte allen Spielern Rechte:p 0 1 ... 1 {':p': 1} False False [punctuation]
14423 <article class="message message--post js-post ... Cer66 War bei deiner Belohnung auch so, hast Glück g... 0 0 ... 1 {':p': 1} False False [punctuation]
14424 <article class="message message--post js-post ... Sparktr Heißt das, ihr trefft euch einmal im Monat und... 0 0 ... 0 {} False True []
14425 <article class="message message--post js-post ... maua1 Also ich bin immer mal ein paar Monate fast je... 0 0 ... 0 {} False True []
[14426 rows x 15 columns]
Du hast noch Tante Sparktr vergessen.Deine letzte Aufgabe habe ich absolviert und do hast sie nicht mal ausprobiert.
Mein dataframe sieht jetzt übrigens so aus:
Processing dauert für 722 Seiten 130 Sekunden. Ists gut Onkel @fscript?Python:raw author content like_count quote_count ... emoji_count emoji_frequency_mapping is_edited is_rules_compliant rulebreak_reasons 0 <article class="message message-threadStarterP... IceCubiee Nun ich wollte mal heute wieder ganz lieb und ... 16 8 ... 9 {':p': 2, ':D': 1, ';)': 3, '^^': 3} True True [] 1 <article class="message message--post js-post ... artfigure Warum sollte die letzte Antwort bitte 32 Dias ... 0 0 ... 1 {':D': 1} False False [punctuation] 2 <article class="message message--post js-post ... Gingernils Das ist der Sinn des Forenspiels: Einfach nur ... 0 0 ... 0 {} False True [] 3 <article class="message message--post js-post ... derschneck_ Mensch ist das fies, sobald man hier was schre... 5 0 ... 1 {';)': 1} False True [] 4 <article class="message message--post js-post ... CreeperGirl2401 Hiermit schreibe ich auch mal was und bitte di... 0 0 ... 1 {':p': 1} False False [punctuation] ... ... ... ... ... ... ... ... ... ... ... ... 14421 <article class="message message--post js-post ... Cer66 @fscriptMir fällt grad ein, dass ich dir die B... 0 0 ... 0 {} False True [] 14422 <article class="message message--post js-post ... maua1 Gib aber bitte allen Spielern Rechte:p 0 1 ... 1 {':p': 1} False False [punctuation] 14423 <article class="message message--post js-post ... Cer66 War bei deiner Belohnung auch so, hast Glück g... 0 0 ... 1 {':p': 1} False False [punctuation] 14424 <article class="message message--post js-post ... Sparktr Heißt das, ihr trefft euch einmal im Monat und... 0 0 ... 0 {} False True [] 14425 <article class="message message--post js-post ... maua1 Also ich bin immer mal ein paar Monate fast je... 0 0 ... 0 {} False True [] [14426 rows x 15 columns]
Na hoffentlich, sonst werde ich wie fscript: böse.Und was wenn nicht? Ich bin in 10 Min fertig...
Bei raw hast du recht, den content brauche ich aber noch.Lange Strings sind hässlich in einem Dataframe oder Numpy-Array. Wenn du Daten prozessiert hast, schleifst du diese nicht weiter. Was macht dein Speicher?
>>> sys.getsizeof(df)
71802653
Wenn du den Content noch brauchst, bist du mit deinem Processing nicht fertig... Also bearbeitest du die Posts mehrfach?Bei raw hast du recht, den content brauche ich aber noch.
Also 71MB.Python:>>> sys.getsizeof(df) 71802653
Ich dachte es wäre nett bei nicht-regelkonformen Beiträgen den Inhalt anzubieten.Wenn du den Content noch brauchst, bist du mit deinem Processing nicht fertig... Also bearbeitest du die Posts mehrfach?
Wir verwenden unerlässliche Cookies, damit diese Website funktioniert, und optionale Cookies, um dein Erlebnis zu verbessern.