Erste Auswertungen

Das Crawler-Projekt läuft nun seit gut über einem Monat. Gerne präsentiere ich in diesem Post meine ersten Erkenntnisse. In diesen ersten Auswertungen handelt es sich noch um relativ «einfache» Auswertungen. Komplexere werden folgen. Falls Ihr Ideen für Auswertungen habt her damit! Und falls sich unter euch MongoDB-Spezis befinden, schreibt mir doch bitte. Das mit der Query-Syntax, Aggregationen etc. bereitet mir noch etwas Kopfschmerzen.

Artikel

Total wurden im Zeitraum vom 2. Oktober 2021 bis 18. November 3'341 verschiedene Artikel gecrawled. In den Artikeln gibt es Meta-Tags – Schlagwörter – welche einem Artikel zugewiesen werden können. Lasst uns diese mal genauer anschauen. Anbei die Top 25 Schlagwörter von 20Min im genannten Zeitraum:

Man sieht deutlich, Corona Dominiert das Medium. Gleich 7 Schlagwörter, welche mit der Pandemie zu tun haben, schafften es in die Top-25. Was sehr erstaunlcih ist, ist das Tag “USA“ es ist das zweit häuffigste und damit mehr verbreitet als etwa Deutschland, Östereich, Italien und sogar fast doppelt so oft vertreten wie die Schweiz. Sehr merkwürdig für ein “Schweizer“-Blatt… Eine kurze manuelles durchsuchen zeigte auf verschiedene “Hauptkategorien“: 89 Befinden sich in “Ausland“ (Big Shock), 15 in “People“, 11 in “Now 2.0“, 4 in “Coronavirus”, 3 in Digital, 3 in “Living“, 3 in “Schweiz“, 2 in “Reisen“, 1 in “one love“ (preach) 1 in “Influencer Radar“ (hilfe), 1 in “Motorsport“.

Kommentare

Was mich hauptsächlioch interessiert sind aber die Kommentare. Wer schreibt wie viel? Was schreiben die Leute. Diesen und weiteren Fragen werde ich in den kommenden Posts auf den Grund gehen. Seit der Pandemie habe ich nähmlich die Vermutung, dass sich Bots oder Menschen, die sich wie Bots verhalten, auf der Plattform rumtreibnen. Total wurden im gemessenen Zeitraum 76’421 Kommentare verfasst (Antworten sind ausgenommen). Da die Kommentare Totel 10 Mal je artikel mit zunehmenden Zeitabständen gecrawled werden, kann ich möglichwerweise feststellen, ob Kommentare verändert oder gelöscht werden. Im gemessenen Zeitraum konnte ich nicht feststellen, dass Kommentare gelöscht wurden (Antworten habe ich noch nicht angesehen).

Aber als erstes Mal eine kleine Rangliste:

Artikel mit den Meisten Kommentaren

  1. «Eindeutig mehr Erektionsstörungen» seit Beginn der Pandemie: 4540 Kommentare
    Hierbei handelt es sich um einen “dauer“ Artikel über die Pandemie. Er wurde am 23.09.2021 zum ersten Mal veröffentlicht und regelmässig mit Updates befüllt. Der Titel ändert sich ebenfafalls. der obengenannte war beim ersten Crawldatum in Verwendung.

  2. Das kommt bei einer Stromkrise auf die Schweizer Bevölkerung zu: 1380 Kommentare

  3. 90 Personen fordern Geld vom BAG wegen «Impfschäden: 1098 Kommentare

  4. Bund kann uns zum Stromsparen zwingen: 1091 Kommentare

  5. Ist die Pandemie in der Schweiz an Weihnachten vorbei?: 1077 Kommentare

Auffallend neben den clickbaity-Titeln von 20min: Covid und eine mögliche Stromknappheit in der Schweiz scheinen die Leser:Innen am meisten zu bewegen, ihre meinung zu hinterlasen.

Kommentare mit den meisten Reaktionen

Auf 20Min haben User die Möglichkeit, einen Kommentar zu bewerten. Und dies ohne Registrierung (juhu). Anbei die Best/schlecht/sonstig bewertenden Kommentare (Antworten nicht berücksichtigt):

Awsome

Artikel: Fehlende Drittimpfung fordert erste Opfer
User: Swagatam

“Meinungen von Experten und Expertinnen tun nichts zur Sache! Aber vielleicht gehen nun auch den Geimpften langsam die Augen auf!?“

Awsome: 2851, bad: 65, nonsense: 664, unnecessary: 36, smart: 25, exact: 466

Bad

Artikel: Rückhalt für Covid-Zertifikat schwindet im Parlament
User: Lamaruga9

”Das Zertifikat muss bleiben und es wird bleiben. Die Gegner finden zwar immer mal wieder sogenannte Argumente dagegen, aber das reicht nicht.”

Awsome: 30, bad, 3560, nonsense: 334, unnecessary: 22, smart: 5, exact: 371


Nonsense

Artikel: «Es kann nicht sein, dass die Schweiz erneut einen Sonderweg fährt»
User: Samas

”Wer nicht geimpft ist, bleibt zu seiner eigenen Sicherheit zu Hause! Somit wäer die Pandemie schnell beendet!”

Awsome: 166, bad: 370, nonsense: 3567, unnecessary: 84, smart: 19, exact: 2512

Unnecessary

Artikel: «Covid-19 ist für Schwangere ein enormes Risiko – die Impfung schützt»
User: Rüedu

”Je seltsamer und komischer sich die Impfverweigerer aufführen.. deshalb von mir ein überzeugtes Ja zum Covid-Gesetz!”

Awsome: 88, bad: 417, nonsense: 465, unnecessary: 1042, smart: 4, exact: 619

Smart

Artikel: In Österreich kommt die 3G-Regel am Arbeitsplatz
User: MarkisMark

”Einfach nur krank.. bitte sofort in der Schweiz einführen. Dann ist das Zertifikat im November Geschichte. Nur wegen der Abstimmung ist es noch nicht verkündet”

Awsome: 37, bad: 89, nonsense: 194, unnecessary: 26, smart: 471, exact: 315

Exact

Artikel: «Es kann nicht sein, dass die Schweiz erneut einen Sonderweg fährt»
User: Vrenelis_Gärtli

”Gerade das Ausland zeigt auf, dass mehr impfen und noch strengere Massnahmen nichts nützen, nur schon unsere Massnahmen sind sehr fragwürdig bezüglich der Verhältnismässigkeit und des gesundheitlichen Nutzen.”

Awsome: 259, bad: 101, nonsense: 1697, unnecessary: 60, smart: 16, exact: 4466

Auch hier lässt sich feststellen, dass Covid DAS Thema Nmmer 1 ist. Alle 6 Kommentare beziehen sich auf Covid. 50% der die 3 “gut bewerteten“ (Exact, Smart, Awsome) sind massnahmenkritische Kommentare, die schelcht bewerteten (bad, nonsense, unnecessary) sprechen sich für die Massnahmen aus.

Die fleissigsten Kommentare-Schreiber

Hier eine Kurze Rangliste mit den aktivsten Kommentatoren. Im gemessenen Zeitraum ergibnt sich folgende Rangliste (Antworten ausgenommen):

  1. Pit48: 329 Kommentare

  2. keinermeiner: 306 Kommentare

  3. Kenyaboy: 300 Kommentare

  4. DidiRougemont: 288 Kommentare

  5. DidiRougemont: 286 Kommentare

  6. emankin: 284 Kommentare

  7. Alpenfurz: 265 Kommentare

  8. vario0: 190 Kommentare

  9. Samas: 190 Kommentare

  10. Hamster007: 187 Kommentare

Gratulation, diese Leute haben bestimmt kein Leben (und ich auch nicht ich schreibe darübe, dass andere Leute zu viele Kommentare schreiben :/)

Ausblick

So einen kurzen ersten Überblick über die Daten haben wir nun erhalten. Aber cih will noch mehr. Eine meine Vermutungen ist, dass sich Bots auf der Plattform rumtreiben. CIh meinte verschiedene Kommentare mehrfach gesehen zu haben und beim Testen habe ich eine Seite mehrfach refresht und habe gesehen, dass gewisse Kommentare sehr schnell an Zustimmung oder Ablehnung gewinnen. Da ich aber weder über den genauen Traffic von 20Min bescheid weiss und grundsätzlich meine Thesen faktenbasiert in die Welt rasublasen will hier ein kleiner Vorgeschmack:

Gibt es Kommentare die 1:1 mehrfach vorkommen?

Ja die gibt es. Des öfteren. Ist das ein Beweis für Botting? Direkt nein, besonders wenn ein Kommentar nicht lange ist. Aber wenn er eine gewisse Länge und Komplexität aufweist und 1:1 mehrfach vorkommt handelt es sich entweder um einen Bot oder einen Menschen der Kommentare Copy-Pasted. Ich sehe keinen rationalen Grund weshalb man einen Kommentar copy-pasten soll.. Shady allemal.

Ein Beispiel Kommentar:

Am 09.11.2020 gab es 770 "neue" Fälle in Dänemark. Heute 1 Jahr später mit Impfung 2562 "neue" Fälle. An alle Maßnahmen Befürworter wie ist das Möglich? Welches Land steht gut da mit hoher Impfquote?? Und im Sommer haben die meisten Regierungen gesagt: Wir schauen nicht mehr auf die Inzidenz, weil ja schon viele Geimpft wurden. Aha

31 Mal kommt dieser Kommentar in meiner Sammlung vor. 334 Zeichen lang, das kann kein Zufall sein. Und auch das deutsche “ß“ scheint mir sehr verdächtig… mehr dazu im nächsten blog-Post </cliffhanger>

Previous
Previous

Mini Update

Next
Next

Better Faster Stronger