Wer als letztes antwortet kriegt viel mehr als nur 128 Dias

Jap. <img> darf gar kein </img> haben. Das wird bs4 verwirren und alles kaputt machen. Du kannst das aber in Text umformen </img> heraus filtern und dann wieder als soup einlesen. :D

Irgendwo anderes gab es aber auch irgend ein interessanten Effekt mit smileys... :hmm:
Ich denke, es stört dich nicht wenn diese 2 Smileys nicht mitzählen :)
Eigentlich wollte ich nur sehr ungern manuell HTML fixen.
 
Also:
Python:
alt = BeautifulSoup(str(emoji)[:-6],, 'html.parser')["alt"]
Oder halt mit re.sub("</img>","",str(emoji)), oder so...
 
Cer66 ich habe eine Aufgabe für dich: Programmiere für mich einen Prototypen vom Spiel Pumuckl fangt den Klabauter.
 
Cer66 ich habe eine Aufgabe für dich: Programmiere für mich einen Prototypen vom Spiel Pumuckl fangt den Klabauter.
Deine letzte Aufgabe habe ich absolviert und do hast sie nicht mal ausprobiert.

Mein dataframe sieht jetzt übrigens so aus:
Python:
                                                     raw           author                                            content  like_count  quote_count  ... emoji_count               emoji_frequency_mapping  is_edited is_rules_compliant  rulebreak_reasons
0      <article class="message message-threadStarterP...        IceCubiee  Nun ich wollte mal heute wieder ganz lieb und ...          16            8  ...           9  {':p': 2, ':D': 1, ';)': 3, '^^': 3}       True               True                 []      
1      <article class="message message--post js-post ...        artfigure  Warum sollte die letzte Antwort bitte 32 Dias ...           0            0  ...           1                             {':D': 1}      False              False      [punctuation]      
2      <article class="message message--post js-post ...       Gingernils  Das ist der Sinn des Forenspiels: Einfach nur ...           0            0  ...           0                                    {}      False               True                 []      
3      <article class="message message--post js-post ...      derschneck_  Mensch ist das fies, sobald man hier was schre...           5            0  ...           1                             {';)': 1}      False               True                 []      
4      <article class="message message--post js-post ...  CreeperGirl2401  Hiermit schreibe ich auch mal was und bitte di...           0            0  ...           1                             {':p': 1}      False              False      [punctuation]      
...                                                  ...              ...                                                ...         ...          ...  ...         ...                                   ...        ...                ...                ...      
14421  <article class="message message--post js-post ...            Cer66  @fscriptMir fällt grad ein, dass ich dir die B...           0            0  ...           0                                    {}      False               True                 []      
14422  <article class="message message--post js-post ...            maua1             Gib aber bitte allen Spielern Rechte:p           0            1  ...           1                             {':p': 1}      False              False      [punctuation]      
14423  <article class="message message--post js-post ...            Cer66  War bei deiner Belohnung auch so, hast Glück g...           0            0  ...           1                             {':p': 1}      False              False      [punctuation]      
14424  <article class="message message--post js-post ...          Sparktr  Heißt das, ihr trefft euch einmal im Monat und...           0            0  ...           0                                    {}      False               True                 []      
14425  <article class="message message--post js-post ...            maua1  Also ich bin immer mal ein paar Monate fast je...           0            0  ...           0                                    {}      False               True                 []      

[14426 rows x 15 columns]
Processing dauert für 722 Seiten 130 Sekunden. Ists gut Onkel @fscript? :)
 
Deine letzte Aufgabe habe ich absolviert und do hast sie nicht mal ausprobiert.

Mein dataframe sieht jetzt übrigens so aus:
Python:
                                                     raw           author                                            content  like_count  quote_count  ... emoji_count               emoji_frequency_mapping  is_edited is_rules_compliant  rulebreak_reasons
0      <article class="message message-threadStarterP...        IceCubiee  Nun ich wollte mal heute wieder ganz lieb und ...          16            8  ...           9  {':p': 2, ':D': 1, ';)': 3, '^^': 3}       True               True                 []     
1      <article class="message message--post js-post ...        artfigure  Warum sollte die letzte Antwort bitte 32 Dias ...           0            0  ...           1                             {':D': 1}      False              False      [punctuation]     
2      <article class="message message--post js-post ...       Gingernils  Das ist der Sinn des Forenspiels: Einfach nur ...           0            0  ...           0                                    {}      False               True                 []     
3      <article class="message message--post js-post ...      derschneck_  Mensch ist das fies, sobald man hier was schre...           5            0  ...           1                             {';)': 1}      False               True                 []     
4      <article class="message message--post js-post ...  CreeperGirl2401  Hiermit schreibe ich auch mal was und bitte di...           0            0  ...           1                             {':p': 1}      False              False      [punctuation]     
...                                                  ...              ...                                                ...         ...          ...  ...         ...                                   ...        ...                ...                ...     
14421  <article class="message message--post js-post ...            Cer66  @fscriptMir fällt grad ein, dass ich dir die B...           0            0  ...           0                                    {}      False               True                 []     
14422  <article class="message message--post js-post ...            maua1             Gib aber bitte allen Spielern Rechte:p           0            1  ...           1                             {':p': 1}      False              False      [punctuation]     
14423  <article class="message message--post js-post ...            Cer66  War bei deiner Belohnung auch so, hast Glück g...           0            0  ...           1                             {':p': 1}      False              False      [punctuation]     
14424  <article class="message message--post js-post ...          Sparktr  Heißt das, ihr trefft euch einmal im Monat und...           0            0  ...           0                                    {}      False               True                 []     
14425  <article class="message message--post js-post ...            maua1  Also ich bin immer mal ein paar Monate fast je...           0            0  ...           0                                    {}      False               True                 []     

[14426 rows x 15 columns]
Processing dauert für 722 Seiten 130 Sekunden. Ists gut Onkel @fscript? :)
Du hast noch Tante Sparktr vergessen.
 
Lange Strings sind hässlich in einem Dataframe oder Numpy-Array. Wenn du Daten prozessiert hast, schleifst du diese nicht weiter. Was macht dein Speicher? :D
 

Benutzer, die dieses Thema gerade lesen

ONLINE 17 Spieler