<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule">

<channel>
	<title>blog.berndweiss.net &#187; Blogometrie</title>
	<atom:link href="http://blog.berndweiss.net/category/blogometrie/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.berndweiss.net</link>
	<description>Unter anderem mit diesen Themen: Quantitative Soziologie, Statistik, R &#38; LaTeX</description>
	<lastBuildDate>Sun, 29 Aug 2010 14:28:54 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
<creativeCommons:license>http://creativecommons.org/licenses/by-nc-sa/3.0/de/</creativeCommons:license>		<item>
		<title>Eine unvollständige Übersicht von empirischen Studien zum Thema Weblogs</title>
		<link>http://blog.berndweiss.net/2008/11/17/eine-unvollstandige-ubersicht-von-empirischen-studien-zum-thema-weblogs/</link>
		<comments>http://blog.berndweiss.net/2008/11/17/eine-unvollstandige-ubersicht-von-empirischen-studien-zum-thema-weblogs/#comments</comments>
		<pubDate>Mon, 17 Nov 2008 18:55:16 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Social Media]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Weblogs]]></category>

		<guid isPermaLink="false">http://www.zahlengesellschaft.de/?p=453</guid>
		<description><![CDATA[Vor einiger Zeit habe ich einen (auf eigenen Wunsch namenlosen) Praktikanten gebeten, sich im WWW umzusehen, welche empirischen Untersuchungen es gibt, die sich mit dem Phänomen Weblogs befassen. Die Ergebnisse dieser Recherche wurden mit einer bereits von mir angelegten Sammlung kombiniert und herausgekommen ist eine etwa 30 Einträge umfassende Liste, die u.a. folgende Merkmale enthält: [...]]]></description>
			<content:encoded><![CDATA[<p>Vor einiger Zeit habe ich einen (auf eigenen Wunsch namenlosen) Praktikanten gebeten, sich im WWW umzusehen, welche empirischen Untersuchungen es gibt, die sich mit dem Phänomen Weblogs befassen. Die Ergebnisse dieser Recherche wurden mit einer bereits von mir angelegten Sammlung kombiniert und herausgekommen ist eine etwa 30 Einträge umfassende Liste, die u.a. folgende Merkmale enthält:</p>
<ul>
<li>Name der Untersuchung</li>
<li>Beginn und Ende</li>
<li>Fallzahl</li>
<li>URL</li>
<li>Verantwortlicher/Institution</li>
<li>Untersuchungsgegenstand</li>
<li>Methodologie</li>
</ul>
<p><span id="more-453"></span></p>
<p>Diese Liste ist unvollständig und sprachlich gewöhnungsbedürftig&#8230; aber eben auch der Anfang einer systematischen Dokumentation von empirischen &#8220;Blog-Studien&#8221;. Ich komme im Moment nicht dazu, mich damit näher zu befassen. Es wäre aber schade, diese Zusammenstellung ungenutzt zu lassen. Deshalb veröffentliche ich sie hiermit, möge sie anderen von Nutzen sein. Die Lizenzbestimmungen finden sich unterhalb dieses Post (Creative Commons Attribution-Noncommercial 2.0 Germany License).</p>
<p style="text-align: center;"><strong>Download als csv-File (Spaltentrenner ist &#8220;;&#8221;): <a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/11/studien-weblogs.csv">studien-weblogs</a></strong></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/11/17/eine-unvollstandige-ubersicht-von-empirischen-studien-zum-thema-weblogs/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Wenn Statistik irritiert – Methodische Anmerkungen zum Beitrag &#8220;Erosion der Intensivleserschaft&#8221; in der M&amp;K 4/2007</title>
		<link>http://blog.berndweiss.net/2008/10/27/wenn-statistik-irritiert-%e2%80%93-methodische-anmerkungen-zum-beitrag-erosion-der-intensivleserschaft-in-der-mk-42007/</link>
		<comments>http://blog.berndweiss.net/2008/10/27/wenn-statistik-irritiert-%e2%80%93-methodische-anmerkungen-zum-beitrag-erosion-der-intensivleserschaft-in-der-mk-42007/#comments</comments>
		<pubDate>Mon, 27 Oct 2008 18:18:50 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Regression]]></category>
		<category><![CDATA[Zeitung]]></category>
		<category><![CDATA[Ökologischer Fehlschluss]]></category>

		<guid isPermaLink="false">http://www.zahlengesellschaft.de/?p=367</guid>
		<description><![CDATA[Vorbemerkungen Eigentlich war es meine Absicht, die nachfolgende Kritik eines Aufsatzes von Kolo und Meyer-Lucht bei der M&#38;K als &#8216;ordentliche&#8217; Replik einzureichen.[1] Ich habe mit einigen Kolleginnen und Kollegen darüber gesprochen, mir auswärtigen Rat eingeholt und dann den Beitrag etwa 6 Monate liegen lassen. In den letzten Tagen habe ich meine Kritik nochmals &#8216;hervorgekramt&#8217;, habe [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Vorbemerkungen</strong></p>
<p>Eigentlich war es meine Absicht, die nachfolgende Kritik eines Aufsatzes von Kolo und Meyer-Lucht bei der <a href="http://www.hans-bredow-institut.de/de/mampk/medien-kommunikationswissenschaft" target="_blank">M&amp;K</a> als &#8216;ordentliche&#8217; Replik einzureichen.[1] Ich habe mit einigen Kolleginnen und Kollegen darüber gesprochen, mir auswärtigen Rat eingeholt und dann den Beitrag etwa 6 Monate liegen lassen. In den letzten Tagen habe ich meine Kritik nochmals &#8216;hervorgekramt&#8217;, habe mich vor allem etwas mit Zeitreihenanalyse beschäftigt und gemerkt, dass Teile meiner Kritik eine durchaus gängige Praxis kritisieren, was diese Kritik wiederum etwas (nicht völlig; etwa die Regression von Anteilswerten) ins Leere laufen lässt. Hinzu kommt, dass es keine fundamentale Kritik ist und die Kernaussage des Artikels, nach der es zu einer „Erosion der Intensivleserschaft“ kommt und „Nachrichtensites“ den Printmedien Nutzer streitig machen, nicht in Frage gestellt wird. Unter diesen Voraussetzungen kommt mir eine Replik bei der M&amp;K etwas übertrieben vor, und daher habe ich mich dazu entschlossen, meine Überlegungen hier auf der <a href="http://www.zahlengesellschaft.de/" target="_blank">Zahlen|Gesellschaft</a> zu veröffentlichen. Zwei weitere Einschränkungen: (1) Es ist kein fertiger Fachartikel, siehe dazu auch die &#8220;<a href="http://www.zahlengesellschaft.de/about/" target="_blank">Zahlen|Gesellschaft als Experimentierfeld</a>&#8220;. (2) (Fast) Unnötig zu erwähnen, dass ich hier ausschließlich meine persönliche Meinung vertrete.</p>
<p><span id="more-367"></span></p>
<p><strong>Einleitung</strong></p>
<p>In Ausgabe 4/2007 der Medien &amp; Kommunikationswissenschaft findet sich ein Beitrag von Kolo und Meyer-Lucht (2007; nachfolgend KML abgekürzt) mit dem Titel &#8220;<a href="http://www.m-und-k.info/MuK/hefte/Aufsatz_07_04.pdf" target="_blank">Erosion der Intensivleserschaft. Eine Zeitreihenanalyse zum Konkurrenzverhältnis von Tageszeitungen und Nachrichtensites</a>&#8220;. In diesem Artikel befassen sich die beiden Autoren mit der Frage, ob beide Mediengattungen in einem komplementären oder substitutiven Verhältnis zu einander stehen. Die späteren empirischen Analysen konzentrieren sich auf die Beantwortung von drei Fragen: „1. Wie verändert sich die Nutzungsintensität von Tageszeitungen und von Nachrichtensites im Zeitverlauf? 2. Welche Faktoren beeinflussen die Nutzungsintensität von Tageszeitungen und von Nachrichtensites sowie deren Veränderungen? 3. Was lässt sich daraus für die Komplementarität oder Substitutivität der Nutzung dieser beiden Mediengattungen folgern?“ (KML: 514). Datengrundlage der Untersuchung ist einerseits die Allensbacher Computer- und Technik-Analyse (ACTA), andererseits die Allensbacher Markt- und Werbeträger-Analyse (AWA).</p>
<p>Die von den Autoren durchgeführten statistischen Analysen sind nach meinem Dafürhalten in vielen Fällen für die Beantwortung der drei Forschungsfragen nicht von Belang, sondern wirken durch den Einsatz von unangemessenen Verfahren sowie der fehlerhaften Befundinterpretationen eher verwirrend. Anliegen dieses Beitrags ist eine kritische Diskussion ausgewählter empirischer Befunde von KML, die vor allem darin besteht, dass ihre Ausführungen eine statistische Genauigkeit suggerieren, die sie gar nicht einhalten können. Im Einzelnen umfasst die Methodenkritik drei Punkte: (1) Die unangemessene Verwendung von linearen Regressionsmodellen sowie (2) die falsche Interpretation von statistischer Signifikanz. (3) Hinzu kommt ein fehlendes Problembewusstsein für ökologische Fehlschlüsse, das heißt den unzulässigen Schluss von Zusammenhängen auf der Aggregatebene auf individuelles Handeln.</p>
<p><strong>Die unangemessenene Verwendung und Interpretation von Regressionsmodellen</strong></p>
<p>(<em>Die in der Vorbemerkung angesprochene Praxis der Zeitreihenanalyse betrifft den nachfolgenden Absatz.  Ich belasse meine Kritik an dieser Stelle und würde mich freuen, wenn mich eine/r eines Besseren belehrt.</em>)</p>
<p>An mehreren Stellen im Aufsatz wird ein zeitlicher Trend, etwa die „Anteile Intensivnutzer überregionaler Nachrichtensites“ (KML: 518, Abbildung 1) mit einem linearen Regressionsmodell „abgesichert“. Um den Trend zu illustrieren, hätte das Einzeichnen der jeweiligen Kurven beziehungsweise Geraden völlig genügt. Doch die Autoren „untermauern“ ihre grafischen Befunde mit den Ergebnissen einer linearen Regression, was zumindest den Eindruck erwecken kann, ein Verständnis des Prozesses erlangt zu haben. Für die überregionalen Abotageszeitungen weisen sie etwa einen „Trend“ (= Regressionskoeffizient) von -0.6 Prozentpunkten pro Jahr (auf zwei Nachkommastellen genau beträgt der Wert -0.58)  aus. Die vollständige Gleichung lautet:</p>
<p style="text-align: center;">y = 1175.15 + (-0.58)*Jahr,</p>
<p>wobei y den Anteil der Intensivleser (überregional) in Prozent bezeichnet. Im Jahr 0 lag dementsprechend der Anteil der Intensivnutzer bei 1175,15% und im Jahre 2027 wird der Anteil etwa -0.51% betragen. Beide Aussagen sind natürlich sinnlos, lassen sich aber aus dem geschätzten Regressionsmodell ableiten und demonstrieren die Gefahren, die mit dem Einsatz solcher Verfahren verbunden sind. Üblicherweise wird bei Prozent- beziehungsweise Anteilswerten statt des linearen Modells eine sogenannte Beta-Regression vorgenommen, die auf den eingeschränkten Wertebereich (zwischen 0% und 100%) der abhängigen Variablen Rücksicht nimmt (Smithson/Verkuilen 2006). Überhaupt ist fraglich, welchen Sinn es hat, bei sechs Analyseeinheiten eine lineare Regression zu schätzen.</p>
<p><em>(Ende der Einschränkung &#8230;)</em></p>
<p>Weitere Regressionsanalysen wurden vermutlich auch anlässlich der Frage nach dem Zusammenhang von Alter und der Nachfrage nach aktuellen Informationen durchgeführt. Die auf Seite 523 formulierte Hypothese lautet: „Die Nachfrage nach aktuellen Informationen über […] Print bzw. […] Online ist jeweils eine Funktion des Alters“. Zumindest lässt der Hinweis auf „eine  Funktion des Alters“ darauf schließen, dass auch hier Regressionsmodelle geschätzt wurden. Doch die Ausführungen dazu  und vor allem Abbildung 3 auf Seite 524 lassen sich nicht nachvollziehen. Dort findet sich der Hinweis auf eine „angepasste Normalverteilung“ beziehungsweise ist einige Zeilen später davon die Rede, „dass man an die Verteilung der Intensivnutzer von Nachrichtensites sehr gut eine Normalverteilung mit einem Mittelwert von 38 Jahren anpassen kann [...]“. Während also die Verteilung der Intensivnutzer einer „Normalverteilung folgen soll“, scheint für die „Intensivleser von Abotageszeitungen ein linearer Anstieg mit dem Alter“ vorzuliegen. Eine Normalverteilung beschreibt die (Häufigkeits-)Verteilung eines Merkmals (Sachs/Hedderich 2006: 191ff). „Angepasste Geraden“ beschreiben dagegen den Zusammenhang zwischen zwei Merkmalen. Es ist unklar, was an dieser Stelle überhaupt untersucht wird. Wird die Altersverteilung der jeweiligen Teilstrichproben von Intensivnutzern und Intensivlesern beschrieben? Interessieren sich die Autoren für den funktionalen Zusammenhang zwischen Nutzungsgrad und Alter?</p>
<p><strong>Fehlerhafte Interpretation des Begriffs der statistischen Signifikanz</strong></p>
<p>Als weitere Absicherung und, so ist zu vermuten, um die „Güte“ des Modells zu belegen, weisen die Autoren „p(lineare Regression)“ aus (im vorliegenden Beispiel auf Seite 518 beträgt dieser Wert 0,009). Zur Interpretation dieser Irrtumswahrscheinlichkeit p schreiben sie: „Die Wahrscheinlichkeit, dass nur zufällig eine Regression mit von 0 verschiedener Steigung vorliegt, beträgt auch hier 0,9 Prozent“ (KML: 518). Diese Auffassung von statistischer Signifikanz ist verbreitet, aber falsch (Haller/Krauss 2002). Die Irrtumswahrscheinlichkeit ist immer eine bedingte Wahrscheinlichkeit, nämlich unter der Bedingung, dass in der Population (der Grundgesamtheit) die H0 korrekt ist. Richtigerweise müsste die Formulierung also lauten: Unter der Bedingung, dass in der Population der Steigungskoeffizient („Trend“) gleich 0 ist, beträgt die Wahrscheinlichkeit mit den verwendeten Daten den ermittelten oder einen extremeren F-Wert (Teststatistik des entsprechenden Omnibustestes des linearen Regressionsmodells) zu erhalten 0,009. Formuliert wird also p(Daten|H0) und nicht p(H0) (Fahrmeir et al. 2001: 409).</p>
<p>Auf Seite 525 wollen die Autoren den „Zusammenhang des Anteils an Intensivlesern mit dem Nachrichtenkonsum im Internet“ näher untersuchen und verwenden dazu Chi-Quadrat, einen verbreiteten Test auf Unterschiedlichkeit. Sie schreiben dazu: „Der Effekt ist zwar bis auf das Alterssegment der 14- bis 17-Jährigen schwach, aber durch das durchgängige Auftreten in fast allen Altersgruppen bei hohen Fallzahlen signifikant. Damit ist Hypothese (4a) bestätigt.“ Meine Interpretation würde wie folgt lauten: Es lässt sich nur ein (sehr) schwacher Effekt beobachten, der aber auf Grund der Fallzahlen signifikant ist. Ein substantieller Befund, der klare Unterschiede zwischen Gruppen beschreibt, ist das eben nicht. Dazu schreiben Sachs/Hedderich (2006: 307; Herv. durch die Autoren): „Betont sei auch, dass <em>formale statistische Signifikanz</em> (nur diese kann ein statistischer Test nachweisen!) und <em>wirkliche (praktische) Bedeutung</em> – Relevanz – nicht miteinander verwechselt werden dürfen“.</p>
<p><strong>Das Problem eines ökologischen Fehlschlusses</strong></p>
<p>Eine der einleitend genannten Forschungsfragen thematisiert Bedingungen, unter denen Nutzer von der einen zu der anderen Mediengattung wechseln (KML: 514): „Welche Faktoren beeinflussen die Nutzungsintensität von Tageszeitungen und von Nachrichtensites sowie deren Veränderungen“? Zu den Voraussetzungen, eine solche Frage angemessen beantworten zu können, schreiben die Autoren weiter unten (KML: 514):</p>
<blockquote><p>„Veränderungen der Mediennutzung lassen sich am verlässlichsten durch eine wiederholte Befragung identischer Personen ermitteln. Nur so kann man direkt die Selektionshandlung – ob singulär oder eher schleichend über sich verändernde Nutzungsintensitäten – dokumentieren.“</p></blockquote>
<p>Ich interpretiere diese Aussage dahingehend, dass man individuelles Verhalten am besten mit Individualdaten erklären kann – dem stimme ich vorbehaltlos zu. Doch die Analysen der Untersuchung basieren (zumindest teilweise und soweit ich das dem Text entnehmen konnte) auf Aggregatdaten und von Zusammenhängen auf Aggregatebene auf individuelles Verhalten schließen zu wollen, wird in den Sozialwissenschaften als „ökologischer Fehlschluss“ bezeichnet (Diekmann 2004: 116ff).[2]</p>
<p>Es wäre falsch, Kolo und Meyer-Lucht an dieser Stelle den Vorwurf des ökologischen Fehlschlusses zu machen. Tatsächlich sind die empirischen Befunde plausibel, so dass es schwer fällt, einen solchen Fehlschluss zu vermuten. Doch es lässt sich ein fehlendes Problembewusstsein erkennen. Gleich die erste Hypothese lautet etwa: „Die Nachfrage nach aktuellen Informationen ist – unabhängig vom Medium – altersabhängig“ (KML: 523). Meiner Meinung nach wird hier ein Zusammenhang auf Individualebene formuliert, doch die Analysen werden, wie oben erwähnt, auf Aggregatdatenebene ausgeführt. Da hilft auch der am Ende der Hypothesen aufgeführte Hinweis nicht viel, dass die „Hypothesen […] so gewählt [wurden], dass auf Basis der vorliegenden Daten […] ein Überprüfung möglich ist“ (KML 523).</p>
<p>Anhand eines einfachen grafisches Beispiels mit simulierten Daten soll das Problem illustriert werden: In Abbildung 1 wird der Zusammenhang zwischen dem Merkmal Alter (hier: 3 Altersgruppen) und der Nachfrage nach aktuellen Informationen untersucht. In der linken Abbildung (1a) finden sich die Befunde der auf der Aggregatebene durchgeführten Analysen. Die rechte Abbildung (1b) enthält die Befunde der Individualdatenanalysen. In der ersten Abbildung zeigt sich ein klar positiver Zusammenhang und unzweifelhaft lautet die (falsche) Interpretation: Mit dem Alter steigt die Nachfrage nach aktuellen Informationen. In der rechten Abbildung (1b) hingegen wurde der Zusammenhang pro Altersgruppe auf Grundlage der Individualdaten errechnet und nun zeigt sich, dass ein negativer Zusammenhang vorliegt. Wie sich gut erkennen lässt, ergibt sich lediglich durch die unterschiedlichen Nachfrageniveaus ein scheinbar positiver Zusammenhang. Bereits dieses einfache Beispiel belegt eindringlich, welche Folgen ein ökologischer Fehlschluss haben kann.</p>
<p style="text-align: center;"><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/10/figoekofehl.png"><img class="size-medium wp-image-371 aligncenter" title="figoekofehl" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/10/figoekofehl-300x223.png" alt="" width="300" height="223" /></a></p>
<p style="text-align: center;">Abbildung 1: Grafische Illustration eines ökologischen Fehlschluss</p>
<p><strong>Zusammenfassung</strong></p>
<p>Die vorangegangenen Ausführungen haben sich mit einigen methodische Unzulänglichkeiten eines von Kolo und Meyer-Lucht verfassten Beitrags mit dem Titel &#8220;Erosion der Intensivleserschaft. Eine Zeitreihenanalyse zum Konkurrenzverhältnis von Tageszeitungen und Nachrichtensites&#8221; befasst. Die Hauptthese des Beitrags wird nicht in Frage gestellt, doch es wird behauptet, dass ein Teil der Analysen im Hinblick auf die Fragestellungen des Artikels überflüssig ist oder falsch durchgeführt wurde. Das betrifft etwa die unangemessene Verwendung von linearen Regressionsmodellen (bei Zeitreihendaten; siehe meine einschränkenden Anmerkungen in den Vorbemerkungen) sowie die Interpretation der Ergebnisse. Ein weiteres Problem betrifft die Verwendung von Aggregatdaten, während die Hypothesen teilweise auf der Individualebene formuliert werden. An keiner Stelle im Artikel findet sich der Hinweis auf einen drohenden ökologischen Fehlschluss.</p>
<p><strong>Endnoten</strong></p>
<p>[1] Erste kritische Anmerkungen von mir zu dem Beitrag von KML finden sich auch auf dem <a href="http://blog.kooptech.de/2008/04/was-journalisten-von-bloggern-lernen-konnen/" target="_blank">KoopTech-Blog</a>.</p>
<p>[2] Die Frage, auf welcher Analyseebene (Individual- oder Aggregatebene) Teile der Untersuchungen letztlich durchgeführt wurden, kann ich nicht beantworten. Eine Nachfrage beim Institut für Demoskopie Allensbach für die ACTA-Daten ergab, dass diese in Verbindung mit einer Software namens mediMACH als Individualdaten bezogen werden können. Inwieweit dann die Analysen, etwa zu den Faktoren der Nutzungsintensität von Tageszeitungen und von Nachrichtensites, diese Individualdaten nutzen, ist mir nicht klar geworden.</p>
<p><strong>Literatur</strong></p>
<p>Diekmann, Andreas, 2004: Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Hamburg: Rowohlt.</p>
<p>Fahrmeir, Ludwig, 2001: Statistik. Der Weg zur Datenanalyse. Berlin [u.a.]: Springer.</p>
<p>Fahrmeir, Ludwig, Thomas Kneib, und Stefan Lang, 2007: Regression: Modelle, Methoden und Anwendungen. Berlin, Heidelberg: Springer.</p>
<p>Haller, Heiko, und Stefan Kraus, 2002: Misinterpretations of significance: A problem students share with their teachers?, Methods of Psychological Research Online 7: 1-20.</p>
<p>Kolo, Castulus, und Robin Meyer-Lucht, 2007: Erosion der Intensivleserschaft. Eine Zeitreihenanalyse zum Konkurrenzverhältnis von Tageszeitungen und Nachrichtensites, Rundfunk und Fernsehen 55: 513-533.</p>
<p>R Development Core Team, 2008: R: A language and environment for statistical computing &lt;http://www.R-project.org&gt;. Wien: R Foundation for Statistical Computing.</p>
<p>Sachs, Lothar, und Jürgen Hedderich, 2006: Angewandte Statistik: Methodensammlung mit R ; mit 180 Tabellen. Berlin u.a.: Springer.</p>
<p>Smithson, Michael, und Jay Verkuilen, 2006: A better lemon squeezer? Maximum-likelihood regression with beta-distributed dependent variables, Psychological Methods 11: 54-71.</p>
<p><strong>Anhang</strong></p>
<p>Der nachfolgende R-Code (R Development Core Team 2008) repliziert einen Teil der Analysen der in Abbildung 1 (oberste Regressionslinie) auf Seite 518 vorgestellten Befunde.<br />
<code>## Anteil Intensivleser (ueberregional) in Prozent<br />
y &lt;- c(15.0, 13.4, 13.6, 12.9, 11.7, 12.1)<br />
## Historisches Jahr<br />
jahr &lt;- c(2001:2006)<br />
## Schaetzen des Regressionsmodells<br />
summary(fit  &lt;- lm(y ~ jahr))<br />
## Neue Daten fuer Vorhersage erzeugen, Jahr 0 sowie den Zeitraum<br />
## von 2006 bis 2030<br />
vorhersage &lt;- data.frame(jahr = c(0,2006:2030))<br />
## Vorhersage ermitteln<br />
predict(fit, vorhersage)</code></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/10/27/wenn-statistik-irritiert-%e2%80%93-methodische-anmerkungen-zum-beitrag-erosion-der-intensivleserschaft-in-der-mk-42007/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Die Glaubwürdigkeit von Blogs nach Nutzer- und Motivgruppen</title>
		<link>http://blog.berndweiss.net/2008/09/26/die-glaubwurdigkeit-von-blogs-nach-nutzer-und-motivgruppen/</link>
		<comments>http://blog.berndweiss.net/2008/09/26/die-glaubwurdigkeit-von-blogs-nach-nutzer-und-motivgruppen/#comments</comments>
		<pubDate>Fri, 26 Sep 2008 20:06:21 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Social Media]]></category>
		<category><![CDATA[Soziologie]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Bibliometrie]]></category>
		<category><![CDATA[Blogs]]></category>
		<category><![CDATA[Glaubwürdigkeit]]></category>

		<guid isPermaLink="false">http://www.zahlengesellschaft.de/?p=317</guid>
		<description><![CDATA[Ein Religionswissenschaftler wirft die Glaubens-, äh, Glaubwürdigkeitsfrage auf Wer sonst als ein Religionswissenschaftler &#8212; nämlich Michael Blume &#8211;, hätte die Debatte um die Glaubwürdigkeit von Blogs anstoßen können. In der ARD/ZDF-Online-Studie 2008 wurden Leser wie auch Blogger befragt und diese kommen mehrheitlich zu dem Schluss, dass die auf Weblogs verbreiteten Informationen nicht glaubwürdig sind. In [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Ein Religionswissenschaftler wirft die Glaubens-, äh, Glaubwürdigkeitsfrage auf</strong></p>
<p>Wer sonst als ein Religionswissenschaftler &#8212; nämlich <a href="http://www.blume-religionswissenschaft.de/">Michael Blume</a> &#8211;, hätte die <a href="http://religionswissenschaft.twoday.net/stories/5212614/" target="_blank">Debatte um die Glaubwürdigkeit von Blogs</a> anstoßen können. In der ARD/ZDF-Online-Studie 2008 wurden Leser wie auch Blogger befragt und diese kommen mehrheitlich zu dem Schluss, dass die auf Weblogs verbreiteten Informationen nicht glaubwürdig sind. In dem Beitrag &#8220;<a href="http://www.zahlengesellschaft.de/2008/09/25/ardzdf-online-studie-2008-kurz-angewarmt/" target="_blank">ARD/ZDF-Online-Studie 2008 kurz angewärmt</a>&#8221; habe ich die Frage aufgeworfen, ob auch Wissenschafts-/WissenschaftlerInnen-Blogs ein Glaubwürdigkeitsproblem haben. Kurz: Wie sinnvoll ist die Annahme, Blogs aller Colour hätten in gleichem Ausmaß Schwierigkeiten damit, ihre Inhalte glaubwürdig an die Frau oder den Mann zu bringen?</p>
<p><span id="more-317"></span></p>
<p><a href="http://www.basicthinking.de/blog/2008/09/26/blogs-ueber-massen-qualitaeten-und-glaubwuerdigkeiten/" target="_blank">Robert Basic</a> hält bereits die Frage für falsch und schreibt <span style="text-decoration: line-through;">&#8211; mit Blick auf Strickblogs &#8211;</span> dazu: &#8220;Die Beurteilung aber von privaten Gesprächen auf Bogs hinsichtlich Qualität und Glaubwürdigkeit ist schlichtweg Bullshit und im höchsten Maße derespektiertlich gegenüber einer Person.&#8221; Kann man so sehen, insbesondere für Fach-/Wissenschafts-/WissenschaftlerInnen-Blogs sollten jedoch strengere Kriterien gelten. Was Basic ähnlich sieht: &#8220;Davon zu trennen sind die Minderheit der Blogs, die sich thematisch und idealtypisch mit einem einzigen Thema auf ihrem Blog auseinandersetzen. Fachblogs eben, die sehr viel stärker auf die Sachebene abheben und denen es um die Vermittlung von Sachinformationen geht.&#8221;</p>
<p><strong>Ausmaß der Glaubwürdigkeit von Blogs nach Nutzergruppen</strong></p>
<p>Als Empiriker möchte ich natürlich Daten haben, die Licht ins unglaubwürdige Dunkel bringen. Auf die Originaldaten der ARD/ZDF-Studie habe ich leider keinen Zugriff, wohl aber auf die Daten der von Jan Schmidt durchgeführten <a href="www.bamberg-gewinnt.de/wordpress/wieichblogge2005/" target="_blank">&#8220;Wie-ich-blogge&#8221;-Studie (WIB)</a>. In dieser Untersuchung findet sich folgende Aussage: &#8220;Weblogs werden niemals so glaubwürdig wie die klassischen Massenmedien sein.&#8221; Dieses Item lässt zwar keine Erkenntnisse über Glaubwürdigkeit an sich zu (was mag das auch sein?), sondern stellt diese in Relation zu &#8220;klassischen Massenmedien&#8221;. Die Antwortmöglichkeiten reichen von 1 („Stimme voll und ganz zu“) bis 5 („Stimme überhaupt nicht zu“). Hohe Werte bedeuten, dass die Befragten Blogs eine hohe Glaubwürdigkeit gegenüber den klassischen Massenmedien einräumen.</p>
<p>Schmidt/Wilbers (2006: 23) berichten einen Gesamtmitteltwert von 3,11, was der Antwortkategorie &#8220;teils-teils&#8221; entspricht. Darüber hinaus stellen sie auch nach Gruppen (Blogger, Ex-Blogger, nur Leser) getrennte Mittelwerte dar, die zwischen 2,88 und 3,13 liegen. Ex-Blogger (2,88) beurteilen die Glaubwürdigkeit von Blogs etwas geringer als noch aktive Blogger (3,13). Die Gruppe der Nur-Leser liegt mit einem Mittelwert von 3,02 dazwischen. Nachfolgende Abbildung unterscheidet noch zwischen Bloggern mit einem und mehreren Blogs.[1] Es wird deutlich, dass &#8220;Multi-Blogger&#8221; am &#8220;gläubigsten&#8221; sind. Die Unterschiede zwischen den Gruppen sind nicht dramatisch groß (die Standardabweichung liegt immerhin bei 1.23 Skalenpunkten), doch man kann sich natürlich fragen, weshalb gerade Ex-Blogger den niedrigsten Wert haben? Sind demgegenüber Befragte mit mehreren Blogs von diesen besonders überzeugt und billigen ihnen daher eine höhere Glaubwürdigkeit zu? (das sind rhetorische Fragen, natürlich kann ich mir ein paar Antworten vorstellen)</p>
<p style="text-align: center;"><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglauben1.jpeg"><img class="aligncenter size-medium wp-image-335" title="figglauben1" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglauben1-300x300.jpg" alt="" width="300" height="300" /></a></p>
<p><strong>Haben auch Fach-/Wissenschafts-/WissenschaftlerInnen-Blogs ein Glaubwürdigkeitsproblem?</strong></p>
<p>Nun ist aber immer noch unklar, in welchem Ausmaß das &#8220;Glaubwürdigkeitsproblem&#8221; auch die Fach-/Wissenschafts-/WissenschaftlerInnen-Blogs betrifft (FWW-Blogs). Wie oben angedeutet, erscheint es doch plausibler, unterschiedlichen Blogformen jeweils ein unterschiedlichen Ausmaß an Glaubwürdigkeit zuzubilligen. Es ist hoffentlich nicht allzu despektierlich, wenn ich beispielsweise &#8220;MC Winkels weblog&#8221; hinsichtlich der Glaubwürdigkeit hinter den ScienceBlogs einordne.  Leider lassen sich mit den WIB-Daten keine Fach-/Wissenschafts-/WissenschaftlerInnen-Blogs identifizieren. Es wurden aber einige Motive des Bloggens abgefragt, die ich mir an anderer Stelle schon einmal angeguckt habe[2]. Hier findet u.a. sich die Aussage, dass gebloggt wird,  &#8220;[u]m mein Wissen in einem Themengebiet anderen zugänglich zu machen&#8221;. Dieser Aussage würde doch fast jeder FWW-BloggerIn zustimmen, oder? Als &#8220;Kontrast&#8221; wähle ich diejenigen, die angaben, nur aus Spaß zu bloggen. Es war in der Befragung möglich, beiden Items (&#8220;Wissen vermitteln&#8221; und &#8220;Spaß&#8221;)  zuzustimmen, doch das scheint eher die Ausnahme gewesen zu sein (Spearman-Korrelation: rho = 0,05). Dieses Vorgehen ist sicherlich nicht unkritisch zu sehen, doch leider gibt es keine besseren Daten.</p>
<p>Die nachfolgende Abbildung vermittelt wiederum einen Eindruck davon, wie die beiden Blogger-Gruppen (linke Abbildung &#8220;Spaß-Blogs&#8221;, rechte Abbildung &#8220;Wissen vermitteln&#8221;-Blogs) geantwortet haben. Der Mittelwert für die Angehörigken der &#8220;Spaß-Blogs&#8221; beträgt 2,96, für die &#8220;Wissen vermitteln&#8221;-Blogs liegt dieser bei 3,15. Nimmt man den gerundeten Wert, dann Antworten beide Gruppen mit &#8220;teils-teils&#8221; auf das Item &#8220;Weblogs werden niemals so glaubwürdig wie die klassischen Massenmedien sein&#8221;, doch die &#8220;Wissen vermitteln&#8221;-Blogger tendieren etwas stärker in Richtig höherer Glaubwürdigkeit. Mit anderen Worten: Betreibe ich selbst ein solches Blog, dann bin ich eher bereit, anderen Blogs mein Vertrauen zu schenken. Welche (psychologischen) Mechanismen dahinter stehen, vermag ich nicht zu sagen. Es kann sein, dass Betreiber eines FWW-Blogs, die sich um eine seriöse Berichterstattung bemühen, ähnliches auch bei anderen Blogs unterstellen. Es kann aber auch auf spezifische Nutzungs-/Rezeptionsroutinen hinweisen, dass heißt, diese Personengruppe liest vorrangig FWW-Blogs.</p>
<p style="text-align: center;"><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglaubennachmotiven.jpeg"><img class="aligncenter size-medium wp-image-321" title="figglaubennachmotiven" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglaubennachmotiven-300x224.jpg" alt="" width="300" height="224" /></a></p>
<p>Dieser Beitrag soll mit einem multiplen (logistischen) Regressionsmodell abgeschlossen werden (N = 3307). Zunächst wurde eine dichotome (0/1) Variable konstruiert, die immer dann den Wert 1 annimmt, wenn der Aussage zugestimmt wurde, dass Weblogs glaubwürdiger sind als die klassischen Massenmedien. Neben dem Alter, dem Geschlecht und dem Bildungsabschluss, wurden die neun abgefragten Blog-Motive erfasst (Multikollinearitätsprobleme lassen wir mal außen vor). Ist der Wert in der Spalte &#8220;Estimate&#8221; negativ, dann weist das auf eine geringere Glaubwürdigkeit hin. Es gibt einen positiven Alterseffekt (+0.01), dass heißt, je älter die Befragten, desto glaubwürdiger werden Blogs beurteilt. Hingegen sind Frauen eher skeptisch (-0,17). Interessanter ist nun die Tatsache, dass &#8220;Wissen zugänglich machen&#8221; nach wie vor einen positiven Effekt von +0.27 hat und &#8220;Spaß&#8221; immer noch einen negativen Wert von -0,18 aufweist.</p>
<p style="text-align: left;"><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figregtabelle.jpeg"><img class="size-full wp-image-326 aligncenter" title="figregtabelle" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figregtabelle.jpeg" alt="" width="500" height="230" /></a></p>
<p style="text-align: left;">
<p style="text-align: left;">Die beiden nachfolgenden Abbildungen veranschaulichen den Effekt des &#8220;Wissen vermitteln&#8221; (bzw. &#8220;zugänglich machen&#8221;) und des &#8220;Spaß-haben&#8221;. Es lässt sich gut erkennen, dass der Effekt der Zustimmung zu dem jeweiligen Motiv nur wenige Prozentpunkte ausmacht.</p>
<p style="text-align: left;"><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglaubewissen.jpg"><img class="size-medium wp-image-353 alignleft" title="figglaubewissen" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglaubewissen-300x300.jpg" alt="" width="300" height="300" /></a><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglaubespass.jpg"><img class="size-medium wp-image-354 alignright" title="figglaubespass" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/figglaubespass-300x300.jpg" alt="" width="300" height="300" /></a></p>
<p style="text-align: left;">
<p><strong>Zusammenfassung</strong></p>
<p>Nach der ARD/ZDF-Online-Studie 2008 haben Blogs ein &#8220;Glaubwürdigkeitsproblem&#8221;. Glaubwürdigkeit wird in diesem kurzen Beitrag in Kontrast zu den &#8220;klassischen Massenmedien&#8221; gesehen. Es stellt sich die Frage, ob davon alle Blogs gleichermaßen betroffen sind. Insbesondere die Fach-/Wissenschafts-/WissenschaftlerInnen-Blog (FWW-Blogs) &#8220;werben&#8221; implizit/explizit mit ihrere Fachkompetenz und hier wäre ein Glaubwürdigkeitsproblem besonders unangenehm. Eine mögliche Erklärungsgröße für die unterschiedliche Bewertungen von Weblogs können unterschiedliche Nutzungspräferenzen sein, was sich im Rahmen dieser kleinen Untersuchung jedoch nicht untersuchen lässt. Bezogen auf die Gruppe der aktiven Blogger zeigt sich, dass die FWW-BloggerInnen eher bereit sind, Blogs im Allgemeinen als glaubwürdig(er) einzustufen.</p>
<p><strong>Endnoten</strong></p>
<p>[1] Die berichteten Mittelwerte unterscheiden sich leicht, weil <a href="http://www.fonk-bamberg.de/pdf/fonkbericht0601.pdf" target="_blank">Schmidt/Wilbers (2006: 23)</a> entgegen ihrer Aussage, die &#8220;Weiß-Nicht&#8221;-Kategorie auszuschließen, diese doch in die Berechnungen aufgenommen haben.</p>
<p>[2] Irgendetwas in diesem Beitrag (&#8220;<a href="http://www.zahlengesellschaft.de/2008/05/25/uberlegungen-zur-faktoriellen-struktur-von-motiven-des-bloggens-in-der-wib-studie/" target="_blank">Überlegungen zur faktoriellen Struktur von Motiven des Bloggens in der WIB-Studie</a>&#8220;) ist mit den Labels passiert, die stimmen vorne und hinten nicht. Verdammte Schlamperei! Wer glaubt mir denn jetzt noch?</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/09/26/die-glaubwurdigkeit-von-blogs-nach-nutzer-und-motivgruppen/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>ARD/ZDF-Online-Studie 2008 kurz angewärmt</title>
		<link>http://blog.berndweiss.net/2008/09/25/ardzdf-online-studie-2008-kurz-angewarmt/</link>
		<comments>http://blog.berndweiss.net/2008/09/25/ardzdf-online-studie-2008-kurz-angewarmt/#comments</comments>
		<pubDate>Thu, 25 Sep 2008 05:55:00 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Faktenwissen]]></category>
		<category><![CDATA[Social Media]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[R]]></category>
		<category><![CDATA[Soziologie der Blogosphäre]]></category>
		<category><![CDATA[Weblogs]]></category>

		<guid isPermaLink="false">http://www.zahlengesellschaft.de/?p=274</guid>
		<description><![CDATA[Vor etwa 2 Monaten wurde die ARD/ZDF-Online-Studie 2008 veröffentlicht (&#8220;Weihnachten war gestern&#8220;). Ich habe davon nicht so viel mitbekommen, weil ich off-line außer Landes war. Meine Aufmerksam wurde von Michael Blumes Beitrag &#8220;Weblogs in der Krise? Befunde der ARD/ZDF-Onlinestudie&#8221; geweckt und so habe ich in einer stillen Minute einen genaueren Blick auf den Teil &#8220;Mitmachnetz [...]]]></description>
			<content:encoded><![CDATA[<p>Vor etwa 2 Monaten wurde die ARD/ZDF-Online-Studie 2008 veröffentlicht (&#8220;<a href="http://www.schmidtmitdete.de/archives/183" target="_blank">Weihnachten war gestern</a>&#8220;). Ich habe davon nicht so viel mitbekommen, weil ich off-line außer Landes war. Meine Aufmerksam wurde von Michael Blumes Beitrag &#8220;<a href="http://religionswissenschaft.twoday.net/stories/5212614/" target="_blank">Weblogs in der Krise? Befunde der ARD/ZDF-Onlinestudie</a>&#8221; geweckt und so habe ich in einer stillen Minute einen genaueren Blick auf den Teil &#8220;<a href="http://www.daserste.de/service/studie08_4.pdf" target="_blank">Mitmachnetz 2.0 &#8211; Rege Beteiligung nur in Communities</a>&#8221; (alle aufgeführten Zahlen wurden diesem Text entnommen) geworfen, um Michaels Beitrag zu kommentieren. Unseligerweise kann man das nun nicht mehr so einfach machen, also habe ich beschlossen, einen kurzen Beitrag zu schreiben, den man an verschiedenen Stellen noch ausbauen könnte, doch dazu fehlt mir die Zeit &#8212; ist ja eigentlich auch nur ein Kommentar.</p>
<p><span id="more-274"></span></p>
<p><strong>Unterscheidet sich die Nutzungszahlen von Blogs zwischen 2007 und 2008?</strong></p>
<p>Mit einem Fokus auf Weblogs ist eine der ersten interessanten Zahlen die &#8220;gelegentliche oder regelmäßige&#8221; Nutzung von Web2.0-Diensten (&#8220;Weblog&#8221;) in den Jahren 2007 und 2008 (Tabell 3, S. 358). Von einer &#8220;gelegentlichen&#8221; Nutzung berichten 2007 11%, 2008 nur noch 6% aller Befragten. Die Zahlen für die &#8220;regelmäßige&#8221; Nutzung liegen bei 3% (2007) beziehungsweise 2% (2008). Naheliegend ist die Frage, ob die Unterschiede der Prozentwerte zwischen den beiden Erhebungszeitpunkten statistisch bedeutsam sind. Tatsächlich zeigt sich, dass die &#8220;gelegentliche&#8221; Nutzung von Weblogs zwischen 2007 und 2008 überzufällig stark gesunken ist (p = 0.00). Das 95%-Konfidenzintervall[1] der Prozentwertdifferenz liegt zwischen 0.026 und 0.073. Das heißt, die in der Stichprobe beobachtete Differenz von 5 Prozentpunkten kann in der Grundgesamtheit aller Onlinenutzer in Deutschland ab 14 Jahren auch bei 2.6 oder 7.3 Prozentpunkten liegen. Für die regelmäßige Nutzung von Weblogs hingegen finden sich keine bedeutsamen Unterschiede (p = 0.11). Zusammenfassend: Die gelegentliche Nutzung von Weblogs hat deutlich abgenommen, die regelmäßige Nutzung weist keine bedeutsamen Veränderungen auf.[2]</p>
<p style="text-align: center;"><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/fignutzung.jpeg"><img class="size-medium wp-image-282 aligncenter" title="fignutzung" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/09/fignutzung-300x299.jpg" alt="" width="300" height="299" /></a></p>
<p><strong>Bedeutung und Glaubwürdigkeit von Weblogs</strong></p>
<p>Tabelle 8 (S. 360) enthält vier Aussagen zu Weblogs, denen &#8220;voll und ganz&#8221;, &#8220;weitgehend&#8221;, &#8220;weniger&#8221; oder &#8220;gar nicht&#8221; zugestimmt werden konnte. In früheren Beiträgen zu der ARD/ZDF-Online-Studie 2008 gehen weder  <a href="http://www.schmidtmitdete.de/archives/183" target="_blank">Jan Schmidt</a> noch <a href="http://religionswissenschaft.twoday.net/stories/5212614/" target="_blank">Michael Blume</a> auf die Tatsache ein, dass dieser Tabelle lediglich Aussagen von 283 von ursprünglich 1186 Befragten zugrunde liegen &#8212; eben genau die Teilstichprobe, die zuvor in Tabelle 7 angegeben hat, Weblogs zu kennen oder zu nutzen. Aus dieser Tabelle repräsentative Aussagen abzuleiten, finde ich gewagt; zumal sich aus Tabelle 7 auch ableiten lässt, dass diese Teilstichprobe eine etwas andere sozialstrukturelle Zusammensetzung aufweist, was wiederum zu Verzerrungen führen kann.</p>
<p>Verwunderlich ist auch, dass gerade einmal 4% der Befragten der Aussage zustimmen, dass die auf Weblogs verbreiteten Informationen voll und ganz glaubwürdig sind. Immerhin 12% stimmen voll und ganz der Aussage zu, dass Weblogs eine Konkurrenz zu professionellen journalistischen Angeboten darstellen. Möglicherweise schätze ich aber auch einfach die Verbindung von &#8220;glaubwürdig&#8221; und &#8220;professionellen journalistischen Angeboten&#8221; falsch ein&#8230;</p>
<p>Es ist im Kontext einer vergleichsweise allgemein gehaltenen Studie natürlich auch müßig darüber zu klagen, dass sämtliche Blogs in einen Topf geworfen werden und Wissenschafts-/WissenschaftlerInnenblogs mit anderen Bloggattungen verglichen werden. Es wäre jedoch interessant zu erfahren, ob auch W-Blogs in gleichem Maße ein Glaubwürdigkeitsproblem haben (immerhin 71% halten die Informationen für wenig oder gar nicht glaubwürdig). Gibt es Spill-over-Effekte?</p>
<p>Es ist bedauerlich, dass die Originaldaten nicht zur Verfügung stehen, mit deren Hilfe die Korrelationsmatrix für die vier Items konstruiert werden könnte. Danach könnte man sich anschauen, ob es ein gemeinsames latentes Konstrukt gibt. Gibt es Gruppen (Nutzungstypen, Bildungsgruppen etc.), wo diese Korrelationsstruktur variiert?</p>
<p><strong>Fußnoten und Anhang</strong></p>
<p>[1] Die Konfidenzintervalle wurden alle sehr naiv ermittelt, siehe dazu <a href="http://cran.r-project.org/doc/contrib/Lemon-kickstart/kr_prop.html" target="_blank">prop.test()</a>.</p>
<p>[2] Man sollte an dieser Stelle anmerken, dass ich gegen das <a href="http://www.bella-beraet.de/nicht-kupieren" target="_blank">Proportionalitätsgesetz</a> verstoße, <a href="http://blog.bissantz.de/logarithmus-1" target="_blank">hier</a> etwas besser erklärt. Mich interessieren aber vor allem die Konfidenzintervalle und die <a href="http://de.wikipedia.org/wiki/Diskussion:Konfidenzintervall#.C3.9Cberschneidung_der_KI" target="_blank">Faustregel</a>, dass sich nicht überlappende Intervalle einen signifikanten Unterschied anzeigen.</p>
<p><strong>Update</strong>: Besagte Faustregel ist, wie sich den Kommentaren entnehmen lässt, eher fraglich. Sich nicht-überlappende Konfidenzintervalle weisen auf einen signifikanten Unterschied hin.</p>
<p><code><br />
## R-Code für die Berechnung der CI und die Konstruktion der Grafik ##<br />
## Test auf Gleichheit von Anteilswerten (H0: p1 == p2 == ... == pn)<br />
## Tabelle 3, S. 358<br />
</code><br />
<code>prop.test(x = c(126,72), n=c(1142,1186))<br />
prop.test(x = c(35,23), n=c(1142,1186))<br />
prop.test(x = c(126+35,72+23), n=c(1142,1186))</code></p>
<p><code>##Konstruktion der Grafik<br />
library(lattice)<br />
library(Hmisc)<br />
jahr <- c(2007,2008,2007,2008)<br />
type <- c("gelegentlich","gelegentlich","regelmaessig","regelmaessig")<br />
anteile <-c(11,6,3,2)<br />
lower <- c(<br />
prop.test(x = c(126), n=c(1142))$conf.int[1]*100,<br />
prop.test(x = c(72), n=c(1186))$conf.int[1]*100,<br />
prop.test(x = c(35), n=c(1142))$conf.int[1]*100,<br />
prop.test(x = c(23), n=c(1186))$conf.int[1]*100<br />
)<br />
upper <-     c(<br />
prop.test(x = c(126), n=c(1142))$conf.int[2]*100,<br />
prop.test(x = c(72), n=c(1186))$conf.int[2]*100,<br />
prop.test(x = c(35), n=c(1142))$conf.int[2]*100,<br />
prop.test(x = c(23), n=c(1186))$conf.int[2]*100<br />
)<br />
ard <- data.frame(jahr,anteile)<br />
xYplot(Cbind(anteile,lower,upper) ~ jahr, group = type,<br />
ylim = c(-0.5,14), xlim = c(2006.5,2008.5), data = ard, type = "b",<br />
main = "Nutzung von Weblogs", ylab = "Anteil in Prozent", xlab = "Jahr",<br />
scales = list(x = list(at = c(2007, 2008))))<br />
</code></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/09/25/ardzdf-online-studie-2008-kurz-angewarmt/feed/</wfw:commentRss>
		<slash:comments>18</slash:comments>
		</item>
		<item>
		<title>Spontane und eher kritische Gedanken zum Scholarz.survey</title>
		<link>http://blog.berndweiss.net/2008/06/04/spontane-und-eher-kritische-gedanken-zum-scholarzsurvey/</link>
		<comments>http://blog.berndweiss.net/2008/06/04/spontane-und-eher-kritische-gedanken-zum-scholarzsurvey/#comments</comments>
		<pubDate>Wed, 04 Jun 2008 16:02:12 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Social Media]]></category>
		<category><![CDATA[Soziologie]]></category>
		<category><![CDATA[scholarz.net Umfrage Online-Befragung]]></category>

		<guid isPermaLink="false">http://www.quantisozblog.de/?p=156</guid>
		<description><![CDATA[scholarz.net ist eine Online-Software für Wissenschaftler, die eine Reihe von Web2.0-Merkmale aufweist. Doch es wird nicht nur Software entwickelt, sondern auch sozialwissenschaftliche Forschung betrieben, nämlich im Rahmen des Forschungsprojekt &#8220;Wissenschaftlich Arbeiten im Web 2.0&#8220;. Die Umfrage (&#8220;scholarz.survey&#8221;) richtet sich an Doktoranden und junge Wissenschaftler. Wissenschaftlerinnen dürfen leider nicht mitmachen (&#8220;Sehr geehrte Wissenschaftler&#8221;). Für heitere Minuten [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://scholarz.net/" target="_blank">scholarz.net</a> ist eine Online-Software für Wissenschaftler, die eine Reihe von Web2.0-Merkmale aufweist. Doch es wird nicht nur Software entwickelt, sondern auch sozialwissenschaftliche Forschung betrieben, nämlich im Rahmen des Forschungsprojekt &#8220;<a href="http://www.quotebook.vwl.uni-wuerzburg.de/" target="_blank">Wissenschaftlich Arbeiten im Web 2.0</a>&#8220;. Die <a href="http://uc.iwm-kmrc.de/uc/scholarz/?a=blog_s" target="_blank">Umfrage (&#8220;scholarz.survey&#8221;)</a> richtet sich an Doktoranden und junge Wissenschaftler. Wissenschaftlerinnen dürfen leider nicht mitmachen (&#8220;Sehr geehrte Wissenschaftler&#8221;).</p>
<p><span id="more-156"></span></p>
<p>Für heitere Minuten sorgte die Antwortkategorie &#8220;weder noch&#8221;. So lautet etwa eine Frage: &#8220;Welche Tools, Anwendungen und Dienste nutzen Sie für Ihre wissenschaftliche Arbeit?&#8221; Ein mögliches Item ist &#8220;scholar.google.com&#8221; und folgende Antwortmöglichkeiten stehen zur Auswahl: &#8220;nutze ich nie&#8221;, &#8220;nutze ich selten&#8221;, &#8220;weder noch&#8221;, &#8220;nutze ich häufig&#8221;, &#8220;nutze ich sehr häufig&#8221;, &#8220;kenne ich nicht&#8221;. Was ist denn &#8220;weder noch&#8221; für eine Antwort?</p>
<p>Auch die Frage &#8220;Welche Themen interessieren Sie in Blogs?&#8221; Lässt sich mit &#8220;weder noch&#8221; beantworten. &#8220;weder noch&#8221; ist hier die Mittelkategorie zwischen    &#8220;interessiert mich überhaupt nicht&#8221; und &#8220;interessiert mich sehr&#8221;.</p>
<p>Sicherlich lässt sich darüber streiten, ob eine differenzierte Antwort auf das Item &#8220;Ich war früher mal in der Wikipedia aktiv&#8221; notwendig ist. &#8220;Trifft es überhaupt nicht zu&#8221;, dass ich früher mal in der Wikipedia aktiv war oder &#8220;trifft eher nicht zu&#8221;, dass ich früher mal in der Wikipedia aktiv war. Vermutlich &#8220;trifft [es, B.W.] eher zu&#8221;, dass ich früher mal in der Wikipedia aktiv war. Ich nehme an, dass das (frühere) Aktivitätsausmaß erfasst werden soll, ob das gelingt, wage ich aber zu bezweifeln.</p>
<p>Items wie &#8220;Desktopbasierte Lösungen helfen mir nichts&#8221; (Frage: &#8220;Aus welchen Gründen präferieren Sie eine webbasierte Lösung?&#8221;) sind kein Stimulus, der Varianz generieren wird. Meine Vermutung &#8212; das Gegenteil lässt sich dann vielleicht bei der Auswertung belegen.</p>
<p>Gewöhnungsbedürftig ist auch die Tatsache, dass sich der Fragebogen komplett durchklicken lässt, ohne eine einzige Antwort gegeben zu haben &#8212; die typische Online-Befragung &#8220;erzwingt&#8221; normalerweise immer einer Antwort, ansonsten geht es nicht weiter. Ich kenne mich aber mit Online-Befragungen nicht wirklich aus und kenne nicht die sich u. U. ergebenden Konsequenzen.</p>
<p>Gibt es eigentlich irgendwelche Fragen zur Soziodemographie (Alter, Geschlecht, Berufserfahrung etc.)? Ich erinnere mich nicht mehr daran &#8212; und noch einen leeren Fragebogen möchte ich nicht mehr produzieren.</p>
<p>Da es eine zweite Befragungswelle geben soll,  besteht die Möglichkeit, den Fragebogen noch einmal an der einen oder anderen Stelle zu überarbeiten.  Um nicht nur zu kritisieren, erkläre ich hiermit meine Bereitschaft als &#8220;Beta-Tester&#8221;.</p>
<p><strong>Nachtrag:</strong></p>
<p>Anlässlich der oben erwähnten Befragung möchte ich auf ein sehr nützliches ZUMA How-to &#8220;<a href="http://www.gesis.org/Publikationen/berichte/ZUMA_How_to/Dokumente/pdf/how-to2rp.pdf" target="_blank">Question Wording – Zur Formulierung von Fragebogen-Fragen</a>&#8221; von Rolf Porst verweisen. Jede/r Sozialwissenschaftler/in sollte einmal im Leben den Kurs &#8220;<a href="http://www.gesis.org/Veranstaltungen/ZUMA/Workshops/WS_2008/Grundlagen_der_Fragebogenentwicklung_Rolf_Porst.htm" target="_blank">Grundlagen der Fragebogenentwicklung</a>&#8221; von Rolf Porst besucht haben. Auch für sein Buch &#8220;<a href="http://www.vs-verlag.de/index.php;do=show/site=w/book_id=9778/sid=845844382484784b502300378394409" target="_blank">Fragebogen. Ein Arbeitsbuch</a>&#8221; möchte ich an dieser Stelle eine Empfehlung aussprechen. Ich gebe zu, in unserer letzen <a href="http://www.fis.uni-koeln.de/docs-www/index.php?id=814" target="_blank">Befragung</a> (mindestens) das 7. Gebot &#8220;Du sollst Fragen mit eindeutigem zeitlichen Bezug verwenden!&#8221; verletzt zu haben.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/06/04/spontane-und-eher-kritische-gedanken-zum-scholarzsurvey/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Ein Tool zur automatischen Erfassung von blog posts sucht&#8230;</title>
		<link>http://blog.berndweiss.net/2008/04/18/ein-tool-zur-automatischen-erfassung-von-blog-posts-sucht/</link>
		<comments>http://blog.berndweiss.net/2008/04/18/ein-tool-zur-automatischen-erfassung-von-blog-posts-sucht/#comments</comments>
		<pubDate>Fri, 18 Apr 2008 03:19:26 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Social Media]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Statistik]]></category>

		<guid isPermaLink="false">http://www.quantisozblog.de/?p=130</guid>
		<description><![CDATA[&#8230;testwillige Personen. Dazu kan man auf der Political Methodology E-Mail List den folgenden Aufruf von Stuart Shulman lesen: Some of you know I have a new penchant for tool-building. Well, the latest creation of the QDAP lab is a blog scraping tool. The tool is designed to allow you to set up accounts to automatically [...]]]></description>
			<content:encoded><![CDATA[<p>&#8230;testwillige Personen. Dazu kan man auf der <a href="http://polmeth.wustl.edu/polmeth.php" target="_blank">Political Methodology E-Mail List</a> den folgenden <a href="http://polmeth.wustl.edu/mailinglist/posting.php?id=34683497&amp;title=April-2008&amp;order=dateposted&amp;startdate=2008-04-01&amp;enddate=2008-04-30" target="_blank">Aufruf</a> von  		Stuart Shulman lesen:</p>
<blockquote><p>Some of you know I have a new penchant for tool-building. Well, the latest creation of the QDAP lab is a blog scraping tool. The tool is designed to allow you to set up accounts to automatically capture blog posts on one or several blogs and to archive the data in a plain text format &#8220;ready-to-be-coded&#8221; inside QDAP&#8217;s Coding Analysis Toolkit.</p>
<p><span id="more-130"></span></p>
<p>For anyone who ever wanted to study blogs, this is a big step forward. The emphasis here is on a user-friendly interface and a seamless system for capturing and coding blog data. Now, this is a brand new tool and probably a bit buggy. However, it works well enough that we invite you to set up an account and start capturing blog data. No doubt there are some of you interested in the blogs and Election 08. To create a new blog scraping account, please visit:</p>
<p><a href="https://surveyweb2.ucsur.pitt.edu/qblog/page_login.php" target="_blank">https://surveyweb2.ucsur.pitt.edu/qblog/page_login.php</a></p>
<p>To learn more about the Coding Analysis Toolkit, please visit:</p>
<p><a href="http://www.qdap.pitt.edu/cat.htm" target="_blank">http://www.qdap.pitt.edu/cat.htm</a></p>
<p>To learn about my lab, please visit:</p>
<p><a href="http://www.qdap.pitt.edu/" target="_blank">http://www.qdap.pitt.edu/</a></p></blockquote>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/04/18/ein-tool-zur-automatischen-erfassung-von-blog-posts-sucht/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lesenswertes &#8220;Social Media Research Blog&#8221;</title>
		<link>http://blog.berndweiss.net/2008/04/04/lesenswertes-social-media-research-blog/</link>
		<comments>http://blog.berndweiss.net/2008/04/04/lesenswertes-social-media-research-blog/#comments</comments>
		<pubDate>Fri, 04 Apr 2008 12:52:16 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Soziologie]]></category>

		<guid isPermaLink="false">http://www.quantisozblog.de/?p=118</guid>
		<description><![CDATA[Matthew Hurst verweist in seinem lesenswerten Blog Data Mining: Text Mining, Visualization and Social Media auf das nicht minder lesenswerte Social Media Research Blog von Akshay Java. Sieht angenehm empirielastig aus. I&#8217;m subscribed too.]]></description>
			<content:encoded><![CDATA[<p><span class="entry-author-name">Matthew Hurst verweist in seinem lesenswerten Blog <a href="http://datamining.typepad.com/data_mining/2008/04/new-social-medi.html" target="_blank">Data Mining: Text Mining, Visualization and Social Media</a> auf das nicht minder lesenswerte <a href="http://socialmedia.typepad.com/blog/" target="_blank">Social Media Research Blog</a> von Akshay Java. Sieht angenehm empirielastig aus. </span> I&#8217;m subscribed too.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/04/04/lesenswertes-social-media-research-blog/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
