Erste Auswertungen
Das Crawler-Projekt läuft nun seit gut über einem Monat. Gerne präsentiere ich in diesem Post meine ersten Erkenntnisse. In diesen ersten Auswertungen handelt es sich noch um relativ «einfache» Auswertungen. Komplexere werden folgen. Falls Ihr Ideen für Auswertungen habt her damit! Und falls sich unter euch MongoDB-Spezis befinden, schreibt mir doch bitte. Das mit der Query-Syntax, Aggregationen etc. bereitet mir noch etwas Kopfschmerzen.
Artikel
Total wurden im Zeitraum vom 2. Oktober 2021 bis 18. November 3'341 verschiedene Artikel gecrawled. In den Artikeln gibt es Meta-Tags – Schlagwörter – welche einem Artikel zugewiesen werden können. Lasst uns diese mal genauer anschauen. Anbei die Top 25 Schlagwörter von 20Min im genannten Zeitraum:
Man sieht deutlich, Corona Dominiert das Medium. Gleich 7 Schlagwörter, welche mit der Pandemie zu tun haben, schafften es in die Top-25. Was sehr erstaunlcih ist, ist das Tag “USA“ es ist das zweit häuffigste und damit mehr verbreitet als etwa Deutschland, Östereich, Italien und sogar fast doppelt so oft vertreten wie die Schweiz. Sehr merkwürdig für ein “Schweizer“-Blatt… Eine kurze manuelles durchsuchen zeigte auf verschiedene “Hauptkategorien“: 89 Befinden sich in “Ausland“ (Big Shock), 15 in “People“, 11 in “Now 2.0“, 4 in “Coronavirus”, 3 in Digital, 3 in “Living“, 3 in “Schweiz“, 2 in “Reisen“, 1 in “one love“ (preach) 1 in “Influencer Radar“ (hilfe), 1 in “Motorsport“.
Kommentare
Was mich hauptsächlioch interessiert sind aber die Kommentare. Wer schreibt wie viel? Was schreiben die Leute. Diesen und weiteren Fragen werde ich in den kommenden Posts auf den Grund gehen. Seit der Pandemie habe ich nähmlich die Vermutung, dass sich Bots oder Menschen, die sich wie Bots verhalten, auf der Plattform rumtreibnen. Total wurden im gemessenen Zeitraum 76’421 Kommentare verfasst (Antworten sind ausgenommen). Da die Kommentare Totel 10 Mal je artikel mit zunehmenden Zeitabständen gecrawled werden, kann ich möglichwerweise feststellen, ob Kommentare verändert oder gelöscht werden. Im gemessenen Zeitraum konnte ich nicht feststellen, dass Kommentare gelöscht wurden (Antworten habe ich noch nicht angesehen).
Aber als erstes Mal eine kleine Rangliste:
Artikel mit den Meisten Kommentaren
«Eindeutig mehr Erektionsstörungen» seit Beginn der Pandemie: 4540 Kommentare
Hierbei handelt es sich um einen “dauer“ Artikel über die Pandemie. Er wurde am 23.09.2021 zum ersten Mal veröffentlicht und regelmässig mit Updates befüllt. Der Titel ändert sich ebenfafalls. der obengenannte war beim ersten Crawldatum in Verwendung.Das kommt bei einer Stromkrise auf die Schweizer Bevölkerung zu: 1380 Kommentare
90 Personen fordern Geld vom BAG wegen «Impfschäden: 1098 Kommentare
Bund kann uns zum Stromsparen zwingen: 1091 Kommentare
Ist die Pandemie in der Schweiz an Weihnachten vorbei?: 1077 Kommentare
Auffallend neben den clickbaity-Titeln von 20min: Covid und eine mögliche Stromknappheit in der Schweiz scheinen die Leser:Innen am meisten zu bewegen, ihre meinung zu hinterlasen.
Kommentare mit den meisten Reaktionen
Auf 20Min haben User die Möglichkeit, einen Kommentar zu bewerten. Und dies ohne Registrierung (juhu). Anbei die Best/schlecht/sonstig bewertenden Kommentare (Antworten nicht berücksichtigt):
Awsome
Artikel: Fehlende Drittimpfung fordert erste Opfer
User: Swagatam
“Meinungen von Experten und Expertinnen tun nichts zur Sache! Aber vielleicht gehen nun auch den Geimpften langsam die Augen auf!?“
Awsome: 2851, bad: 65, nonsense: 664, unnecessary: 36, smart: 25, exact: 466
Bad
Artikel: Rückhalt für Covid-Zertifikat schwindet im Parlament
User: Lamaruga9
”Das Zertifikat muss bleiben und es wird bleiben. Die Gegner finden zwar immer mal wieder sogenannte Argumente dagegen, aber das reicht nicht.”
Awsome: 30, bad, 3560, nonsense: 334, unnecessary: 22, smart: 5, exact: 371
Nonsense
Artikel: «Es kann nicht sein, dass die Schweiz erneut einen Sonderweg fährt»
User: Samas
”Wer nicht geimpft ist, bleibt zu seiner eigenen Sicherheit zu Hause! Somit wäer die Pandemie schnell beendet!”
Awsome: 166, bad: 370, nonsense: 3567, unnecessary: 84, smart: 19, exact: 2512
Unnecessary
Artikel: «Covid-19 ist für Schwangere ein enormes Risiko – die Impfung schützt»
User: Rüedu
”Je seltsamer und komischer sich die Impfverweigerer aufführen.. deshalb von mir ein überzeugtes Ja zum Covid-Gesetz!”
Awsome: 88, bad: 417, nonsense: 465, unnecessary: 1042, smart: 4, exact: 619
Smart
Artikel: In Österreich kommt die 3G-Regel am Arbeitsplatz
User: MarkisMark
”Einfach nur krank.. bitte sofort in der Schweiz einführen. Dann ist das Zertifikat im November Geschichte. Nur wegen der Abstimmung ist es noch nicht verkündet”
Awsome: 37, bad: 89, nonsense: 194, unnecessary: 26, smart: 471, exact: 315
Exact
Artikel: «Es kann nicht sein, dass die Schweiz erneut einen Sonderweg fährt»
User: Vrenelis_Gärtli
”Gerade das Ausland zeigt auf, dass mehr impfen und noch strengere Massnahmen nichts nützen, nur schon unsere Massnahmen sind sehr fragwürdig bezüglich der Verhältnismässigkeit und des gesundheitlichen Nutzen.”
Awsome: 259, bad: 101, nonsense: 1697, unnecessary: 60, smart: 16, exact: 4466
Auch hier lässt sich feststellen, dass Covid DAS Thema Nmmer 1 ist. Alle 6 Kommentare beziehen sich auf Covid. 50% der die 3 “gut bewerteten“ (Exact, Smart, Awsome) sind massnahmenkritische Kommentare, die schelcht bewerteten (bad, nonsense, unnecessary) sprechen sich für die Massnahmen aus.
Die fleissigsten Kommentare-Schreiber
Hier eine Kurze Rangliste mit den aktivsten Kommentatoren. Im gemessenen Zeitraum ergibnt sich folgende Rangliste (Antworten ausgenommen):
Pit48: 329 Kommentare
keinermeiner: 306 Kommentare
Kenyaboy: 300 Kommentare
DidiRougemont: 288 Kommentare
DidiRougemont: 286 Kommentare
emankin: 284 Kommentare
Alpenfurz: 265 Kommentare
vario0: 190 Kommentare
Samas: 190 Kommentare
Hamster007: 187 Kommentare
Gratulation, diese Leute haben bestimmt kein Leben (und ich auch nicht ich schreibe darübe, dass andere Leute zu viele Kommentare schreiben :/)
Ausblick
So einen kurzen ersten Überblick über die Daten haben wir nun erhalten. Aber cih will noch mehr. Eine meine Vermutungen ist, dass sich Bots auf der Plattform rumtreiben. CIh meinte verschiedene Kommentare mehrfach gesehen zu haben und beim Testen habe ich eine Seite mehrfach refresht und habe gesehen, dass gewisse Kommentare sehr schnell an Zustimmung oder Ablehnung gewinnen. Da ich aber weder über den genauen Traffic von 20Min bescheid weiss und grundsätzlich meine Thesen faktenbasiert in die Welt rasublasen will hier ein kleiner Vorgeschmack:
Gibt es Kommentare die 1:1 mehrfach vorkommen?
Ja die gibt es. Des öfteren. Ist das ein Beweis für Botting? Direkt nein, besonders wenn ein Kommentar nicht lange ist. Aber wenn er eine gewisse Länge und Komplexität aufweist und 1:1 mehrfach vorkommt handelt es sich entweder um einen Bot oder einen Menschen der Kommentare Copy-Pasted. Ich sehe keinen rationalen Grund weshalb man einen Kommentar copy-pasten soll.. Shady allemal.
Ein Beispiel Kommentar:
Am 09.11.2020 gab es 770 "neue" Fälle in Dänemark. Heute 1 Jahr später mit Impfung 2562 "neue" Fälle. An alle Maßnahmen Befürworter wie ist das Möglich? Welches Land steht gut da mit hoher Impfquote?? Und im Sommer haben die meisten Regierungen gesagt: Wir schauen nicht mehr auf die Inzidenz, weil ja schon viele Geimpft wurden. Aha
31 Mal kommt dieser Kommentar in meiner Sammlung vor. 334 Zeichen lang, das kann kein Zufall sein. Und auch das deutsche “ß“ scheint mir sehr verdächtig… mehr dazu im nächsten blog-Post </cliffhanger>