Gibt es einen Grund fürHier ist übrigens der relevante code um auf Regelkonformität zu prüfen:
.Python:# ... def _count_words(string_: str) -> int: return len(re.split(rf"[\s{string.punctuation}]", string_)) # ... def check_rules_compliance( content: str, word_count_: int ) -> tuple[bool, list[Optional[str]]]: # Rules: # - At least 5 words (word_count) # - First letter must be capitalized (first_letter) # - Trailing punctuation (punctuation) compliance = { "word_count": True, "first_letter": True, "punctuation": True, } if word_count_ < 5: compliance["word_count"] = False try: first_letter_index = _find_first_letter_index(content) if first_letter_index is None: # No letter in msg compliance["first_letter"] = False elif not content[first_letter_index].isupper(): compliance["first_letter"] = False if content[-1] not in string.punctuation: compliance["punctuation"] = False except IndexError: # Content is empty. Example: https://uwmc.de/p108813 compliance["first_letter"] = False compliance["punctuation"] = False broken_rules: list[Optional[str]] = [ key for key, value in compliance.items() if not value ] return (not any(broken_rules), broken_rules) # ... def _find_first_letter_index(string_: str): for char in string_: if char in string.ascii_letters: return string_.index(char) return None
re.split
statt string_.split
?Ansonsten fällt halt nur das mit den Umlauten auf. Ich entferne Schlichtweg die gängigen Zeichen und prüfe dann auf upper.
Einige von denen wären vermutlich nicht konform. Die mit den deutschen oder französischen Anführunszeichen, die hochgestellte 1 und das Unicode Smily dürften nicht als korrekt erkannt werden.Wie wäre es mit Bond, Jane Bond?
@Fscript, @Cer66, was für Satzzeichen zählen eigentlich am Satzende? Und wie sieht es mit den Klammern von BBCode-Befehlen aus, oder wir nur der für Benutzer:innen direkt lesbare Text ausgewertet und Spoiler etc. ignoriert? Smileys würden laut Startpost als Satzzeichen zählen, aber was ist mit der elektronischen Statistik?
So, Testzeit: Welche dieser Beiträge würden für sich als Regelkonform zählen?
xoxo, Jane Bond im Dienste ihrer Sparktrtät
@Cer66 könnte volle unicode Unterstützung implementieren.
EDIT: Nur der Text dürfte ausgewertet werden, nicht der BB-Code (zumindest bei mir).