<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule">

<channel>
	<title>blog.berndweiss.net &#187; Regression</title>
	<atom:link href="http://blog.berndweiss.net/tag/regression/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.berndweiss.net</link>
	<description>Unter anderem mit diesen Themen: Quantitative Soziologie, Statistik, R &#38; LaTeX</description>
	<lastBuildDate>Sun, 29 Aug 2010 14:28:54 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
<creativeCommons:license>http://creativecommons.org/licenses/by-nc-sa/3.0/de/</creativeCommons:license>		<item>
		<title>Wenn Statistik irritiert – Methodische Anmerkungen zum Beitrag &#8220;Erosion der Intensivleserschaft&#8221; in der M&amp;K 4/2007</title>
		<link>http://blog.berndweiss.net/2008/10/27/wenn-statistik-irritiert-%e2%80%93-methodische-anmerkungen-zum-beitrag-erosion-der-intensivleserschaft-in-der-mk-42007/</link>
		<comments>http://blog.berndweiss.net/2008/10/27/wenn-statistik-irritiert-%e2%80%93-methodische-anmerkungen-zum-beitrag-erosion-der-intensivleserschaft-in-der-mk-42007/#comments</comments>
		<pubDate>Mon, 27 Oct 2008 18:18:50 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Blogometrie]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Regression]]></category>
		<category><![CDATA[Zeitung]]></category>
		<category><![CDATA[Ökologischer Fehlschluss]]></category>

		<guid isPermaLink="false">http://www.zahlengesellschaft.de/?p=367</guid>
		<description><![CDATA[Vorbemerkungen Eigentlich war es meine Absicht, die nachfolgende Kritik eines Aufsatzes von Kolo und Meyer-Lucht bei der M&#38;K als &#8216;ordentliche&#8217; Replik einzureichen.[1] Ich habe mit einigen Kolleginnen und Kollegen darüber gesprochen, mir auswärtigen Rat eingeholt und dann den Beitrag etwa 6 Monate liegen lassen. In den letzten Tagen habe ich meine Kritik nochmals &#8216;hervorgekramt&#8217;, habe [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Vorbemerkungen</strong></p>
<p>Eigentlich war es meine Absicht, die nachfolgende Kritik eines Aufsatzes von Kolo und Meyer-Lucht bei der <a href="http://www.hans-bredow-institut.de/de/mampk/medien-kommunikationswissenschaft" target="_blank">M&amp;K</a> als &#8216;ordentliche&#8217; Replik einzureichen.[1] Ich habe mit einigen Kolleginnen und Kollegen darüber gesprochen, mir auswärtigen Rat eingeholt und dann den Beitrag etwa 6 Monate liegen lassen. In den letzten Tagen habe ich meine Kritik nochmals &#8216;hervorgekramt&#8217;, habe mich vor allem etwas mit Zeitreihenanalyse beschäftigt und gemerkt, dass Teile meiner Kritik eine durchaus gängige Praxis kritisieren, was diese Kritik wiederum etwas (nicht völlig; etwa die Regression von Anteilswerten) ins Leere laufen lässt. Hinzu kommt, dass es keine fundamentale Kritik ist und die Kernaussage des Artikels, nach der es zu einer „Erosion der Intensivleserschaft“ kommt und „Nachrichtensites“ den Printmedien Nutzer streitig machen, nicht in Frage gestellt wird. Unter diesen Voraussetzungen kommt mir eine Replik bei der M&amp;K etwas übertrieben vor, und daher habe ich mich dazu entschlossen, meine Überlegungen hier auf der <a href="http://www.zahlengesellschaft.de/" target="_blank">Zahlen|Gesellschaft</a> zu veröffentlichen. Zwei weitere Einschränkungen: (1) Es ist kein fertiger Fachartikel, siehe dazu auch die &#8220;<a href="http://www.zahlengesellschaft.de/about/" target="_blank">Zahlen|Gesellschaft als Experimentierfeld</a>&#8220;. (2) (Fast) Unnötig zu erwähnen, dass ich hier ausschließlich meine persönliche Meinung vertrete.</p>
<p><span id="more-367"></span></p>
<p><strong>Einleitung</strong></p>
<p>In Ausgabe 4/2007 der Medien &amp; Kommunikationswissenschaft findet sich ein Beitrag von Kolo und Meyer-Lucht (2007; nachfolgend KML abgekürzt) mit dem Titel &#8220;<a href="http://www.m-und-k.info/MuK/hefte/Aufsatz_07_04.pdf" target="_blank">Erosion der Intensivleserschaft. Eine Zeitreihenanalyse zum Konkurrenzverhältnis von Tageszeitungen und Nachrichtensites</a>&#8220;. In diesem Artikel befassen sich die beiden Autoren mit der Frage, ob beide Mediengattungen in einem komplementären oder substitutiven Verhältnis zu einander stehen. Die späteren empirischen Analysen konzentrieren sich auf die Beantwortung von drei Fragen: „1. Wie verändert sich die Nutzungsintensität von Tageszeitungen und von Nachrichtensites im Zeitverlauf? 2. Welche Faktoren beeinflussen die Nutzungsintensität von Tageszeitungen und von Nachrichtensites sowie deren Veränderungen? 3. Was lässt sich daraus für die Komplementarität oder Substitutivität der Nutzung dieser beiden Mediengattungen folgern?“ (KML: 514). Datengrundlage der Untersuchung ist einerseits die Allensbacher Computer- und Technik-Analyse (ACTA), andererseits die Allensbacher Markt- und Werbeträger-Analyse (AWA).</p>
<p>Die von den Autoren durchgeführten statistischen Analysen sind nach meinem Dafürhalten in vielen Fällen für die Beantwortung der drei Forschungsfragen nicht von Belang, sondern wirken durch den Einsatz von unangemessenen Verfahren sowie der fehlerhaften Befundinterpretationen eher verwirrend. Anliegen dieses Beitrags ist eine kritische Diskussion ausgewählter empirischer Befunde von KML, die vor allem darin besteht, dass ihre Ausführungen eine statistische Genauigkeit suggerieren, die sie gar nicht einhalten können. Im Einzelnen umfasst die Methodenkritik drei Punkte: (1) Die unangemessene Verwendung von linearen Regressionsmodellen sowie (2) die falsche Interpretation von statistischer Signifikanz. (3) Hinzu kommt ein fehlendes Problembewusstsein für ökologische Fehlschlüsse, das heißt den unzulässigen Schluss von Zusammenhängen auf der Aggregatebene auf individuelles Handeln.</p>
<p><strong>Die unangemessenene Verwendung und Interpretation von Regressionsmodellen</strong></p>
<p>(<em>Die in der Vorbemerkung angesprochene Praxis der Zeitreihenanalyse betrifft den nachfolgenden Absatz.  Ich belasse meine Kritik an dieser Stelle und würde mich freuen, wenn mich eine/r eines Besseren belehrt.</em>)</p>
<p>An mehreren Stellen im Aufsatz wird ein zeitlicher Trend, etwa die „Anteile Intensivnutzer überregionaler Nachrichtensites“ (KML: 518, Abbildung 1) mit einem linearen Regressionsmodell „abgesichert“. Um den Trend zu illustrieren, hätte das Einzeichnen der jeweiligen Kurven beziehungsweise Geraden völlig genügt. Doch die Autoren „untermauern“ ihre grafischen Befunde mit den Ergebnissen einer linearen Regression, was zumindest den Eindruck erwecken kann, ein Verständnis des Prozesses erlangt zu haben. Für die überregionalen Abotageszeitungen weisen sie etwa einen „Trend“ (= Regressionskoeffizient) von -0.6 Prozentpunkten pro Jahr (auf zwei Nachkommastellen genau beträgt der Wert -0.58)  aus. Die vollständige Gleichung lautet:</p>
<p style="text-align: center;">y = 1175.15 + (-0.58)*Jahr,</p>
<p>wobei y den Anteil der Intensivleser (überregional) in Prozent bezeichnet. Im Jahr 0 lag dementsprechend der Anteil der Intensivnutzer bei 1175,15% und im Jahre 2027 wird der Anteil etwa -0.51% betragen. Beide Aussagen sind natürlich sinnlos, lassen sich aber aus dem geschätzten Regressionsmodell ableiten und demonstrieren die Gefahren, die mit dem Einsatz solcher Verfahren verbunden sind. Üblicherweise wird bei Prozent- beziehungsweise Anteilswerten statt des linearen Modells eine sogenannte Beta-Regression vorgenommen, die auf den eingeschränkten Wertebereich (zwischen 0% und 100%) der abhängigen Variablen Rücksicht nimmt (Smithson/Verkuilen 2006). Überhaupt ist fraglich, welchen Sinn es hat, bei sechs Analyseeinheiten eine lineare Regression zu schätzen.</p>
<p><em>(Ende der Einschränkung &#8230;)</em></p>
<p>Weitere Regressionsanalysen wurden vermutlich auch anlässlich der Frage nach dem Zusammenhang von Alter und der Nachfrage nach aktuellen Informationen durchgeführt. Die auf Seite 523 formulierte Hypothese lautet: „Die Nachfrage nach aktuellen Informationen über […] Print bzw. […] Online ist jeweils eine Funktion des Alters“. Zumindest lässt der Hinweis auf „eine  Funktion des Alters“ darauf schließen, dass auch hier Regressionsmodelle geschätzt wurden. Doch die Ausführungen dazu  und vor allem Abbildung 3 auf Seite 524 lassen sich nicht nachvollziehen. Dort findet sich der Hinweis auf eine „angepasste Normalverteilung“ beziehungsweise ist einige Zeilen später davon die Rede, „dass man an die Verteilung der Intensivnutzer von Nachrichtensites sehr gut eine Normalverteilung mit einem Mittelwert von 38 Jahren anpassen kann [...]“. Während also die Verteilung der Intensivnutzer einer „Normalverteilung folgen soll“, scheint für die „Intensivleser von Abotageszeitungen ein linearer Anstieg mit dem Alter“ vorzuliegen. Eine Normalverteilung beschreibt die (Häufigkeits-)Verteilung eines Merkmals (Sachs/Hedderich 2006: 191ff). „Angepasste Geraden“ beschreiben dagegen den Zusammenhang zwischen zwei Merkmalen. Es ist unklar, was an dieser Stelle überhaupt untersucht wird. Wird die Altersverteilung der jeweiligen Teilstrichproben von Intensivnutzern und Intensivlesern beschrieben? Interessieren sich die Autoren für den funktionalen Zusammenhang zwischen Nutzungsgrad und Alter?</p>
<p><strong>Fehlerhafte Interpretation des Begriffs der statistischen Signifikanz</strong></p>
<p>Als weitere Absicherung und, so ist zu vermuten, um die „Güte“ des Modells zu belegen, weisen die Autoren „p(lineare Regression)“ aus (im vorliegenden Beispiel auf Seite 518 beträgt dieser Wert 0,009). Zur Interpretation dieser Irrtumswahrscheinlichkeit p schreiben sie: „Die Wahrscheinlichkeit, dass nur zufällig eine Regression mit von 0 verschiedener Steigung vorliegt, beträgt auch hier 0,9 Prozent“ (KML: 518). Diese Auffassung von statistischer Signifikanz ist verbreitet, aber falsch (Haller/Krauss 2002). Die Irrtumswahrscheinlichkeit ist immer eine bedingte Wahrscheinlichkeit, nämlich unter der Bedingung, dass in der Population (der Grundgesamtheit) die H0 korrekt ist. Richtigerweise müsste die Formulierung also lauten: Unter der Bedingung, dass in der Population der Steigungskoeffizient („Trend“) gleich 0 ist, beträgt die Wahrscheinlichkeit mit den verwendeten Daten den ermittelten oder einen extremeren F-Wert (Teststatistik des entsprechenden Omnibustestes des linearen Regressionsmodells) zu erhalten 0,009. Formuliert wird also p(Daten|H0) und nicht p(H0) (Fahrmeir et al. 2001: 409).</p>
<p>Auf Seite 525 wollen die Autoren den „Zusammenhang des Anteils an Intensivlesern mit dem Nachrichtenkonsum im Internet“ näher untersuchen und verwenden dazu Chi-Quadrat, einen verbreiteten Test auf Unterschiedlichkeit. Sie schreiben dazu: „Der Effekt ist zwar bis auf das Alterssegment der 14- bis 17-Jährigen schwach, aber durch das durchgängige Auftreten in fast allen Altersgruppen bei hohen Fallzahlen signifikant. Damit ist Hypothese (4a) bestätigt.“ Meine Interpretation würde wie folgt lauten: Es lässt sich nur ein (sehr) schwacher Effekt beobachten, der aber auf Grund der Fallzahlen signifikant ist. Ein substantieller Befund, der klare Unterschiede zwischen Gruppen beschreibt, ist das eben nicht. Dazu schreiben Sachs/Hedderich (2006: 307; Herv. durch die Autoren): „Betont sei auch, dass <em>formale statistische Signifikanz</em> (nur diese kann ein statistischer Test nachweisen!) und <em>wirkliche (praktische) Bedeutung</em> – Relevanz – nicht miteinander verwechselt werden dürfen“.</p>
<p><strong>Das Problem eines ökologischen Fehlschlusses</strong></p>
<p>Eine der einleitend genannten Forschungsfragen thematisiert Bedingungen, unter denen Nutzer von der einen zu der anderen Mediengattung wechseln (KML: 514): „Welche Faktoren beeinflussen die Nutzungsintensität von Tageszeitungen und von Nachrichtensites sowie deren Veränderungen“? Zu den Voraussetzungen, eine solche Frage angemessen beantworten zu können, schreiben die Autoren weiter unten (KML: 514):</p>
<blockquote><p>„Veränderungen der Mediennutzung lassen sich am verlässlichsten durch eine wiederholte Befragung identischer Personen ermitteln. Nur so kann man direkt die Selektionshandlung – ob singulär oder eher schleichend über sich verändernde Nutzungsintensitäten – dokumentieren.“</p></blockquote>
<p>Ich interpretiere diese Aussage dahingehend, dass man individuelles Verhalten am besten mit Individualdaten erklären kann – dem stimme ich vorbehaltlos zu. Doch die Analysen der Untersuchung basieren (zumindest teilweise und soweit ich das dem Text entnehmen konnte) auf Aggregatdaten und von Zusammenhängen auf Aggregatebene auf individuelles Verhalten schließen zu wollen, wird in den Sozialwissenschaften als „ökologischer Fehlschluss“ bezeichnet (Diekmann 2004: 116ff).[2]</p>
<p>Es wäre falsch, Kolo und Meyer-Lucht an dieser Stelle den Vorwurf des ökologischen Fehlschlusses zu machen. Tatsächlich sind die empirischen Befunde plausibel, so dass es schwer fällt, einen solchen Fehlschluss zu vermuten. Doch es lässt sich ein fehlendes Problembewusstsein erkennen. Gleich die erste Hypothese lautet etwa: „Die Nachfrage nach aktuellen Informationen ist – unabhängig vom Medium – altersabhängig“ (KML: 523). Meiner Meinung nach wird hier ein Zusammenhang auf Individualebene formuliert, doch die Analysen werden, wie oben erwähnt, auf Aggregatdatenebene ausgeführt. Da hilft auch der am Ende der Hypothesen aufgeführte Hinweis nicht viel, dass die „Hypothesen […] so gewählt [wurden], dass auf Basis der vorliegenden Daten […] ein Überprüfung möglich ist“ (KML 523).</p>
<p>Anhand eines einfachen grafisches Beispiels mit simulierten Daten soll das Problem illustriert werden: In Abbildung 1 wird der Zusammenhang zwischen dem Merkmal Alter (hier: 3 Altersgruppen) und der Nachfrage nach aktuellen Informationen untersucht. In der linken Abbildung (1a) finden sich die Befunde der auf der Aggregatebene durchgeführten Analysen. Die rechte Abbildung (1b) enthält die Befunde der Individualdatenanalysen. In der ersten Abbildung zeigt sich ein klar positiver Zusammenhang und unzweifelhaft lautet die (falsche) Interpretation: Mit dem Alter steigt die Nachfrage nach aktuellen Informationen. In der rechten Abbildung (1b) hingegen wurde der Zusammenhang pro Altersgruppe auf Grundlage der Individualdaten errechnet und nun zeigt sich, dass ein negativer Zusammenhang vorliegt. Wie sich gut erkennen lässt, ergibt sich lediglich durch die unterschiedlichen Nachfrageniveaus ein scheinbar positiver Zusammenhang. Bereits dieses einfache Beispiel belegt eindringlich, welche Folgen ein ökologischer Fehlschluss haben kann.</p>
<p style="text-align: center;"><a href="http://www.zahlengesellschaft.de/wp-content/uploads/2008/10/figoekofehl.png"><img class="size-medium wp-image-371 aligncenter" title="figoekofehl" src="http://www.zahlengesellschaft.de/wp-content/uploads/2008/10/figoekofehl-300x223.png" alt="" width="300" height="223" /></a></p>
<p style="text-align: center;">Abbildung 1: Grafische Illustration eines ökologischen Fehlschluss</p>
<p><strong>Zusammenfassung</strong></p>
<p>Die vorangegangenen Ausführungen haben sich mit einigen methodische Unzulänglichkeiten eines von Kolo und Meyer-Lucht verfassten Beitrags mit dem Titel &#8220;Erosion der Intensivleserschaft. Eine Zeitreihenanalyse zum Konkurrenzverhältnis von Tageszeitungen und Nachrichtensites&#8221; befasst. Die Hauptthese des Beitrags wird nicht in Frage gestellt, doch es wird behauptet, dass ein Teil der Analysen im Hinblick auf die Fragestellungen des Artikels überflüssig ist oder falsch durchgeführt wurde. Das betrifft etwa die unangemessene Verwendung von linearen Regressionsmodellen (bei Zeitreihendaten; siehe meine einschränkenden Anmerkungen in den Vorbemerkungen) sowie die Interpretation der Ergebnisse. Ein weiteres Problem betrifft die Verwendung von Aggregatdaten, während die Hypothesen teilweise auf der Individualebene formuliert werden. An keiner Stelle im Artikel findet sich der Hinweis auf einen drohenden ökologischen Fehlschluss.</p>
<p><strong>Endnoten</strong></p>
<p>[1] Erste kritische Anmerkungen von mir zu dem Beitrag von KML finden sich auch auf dem <a href="http://blog.kooptech.de/2008/04/was-journalisten-von-bloggern-lernen-konnen/" target="_blank">KoopTech-Blog</a>.</p>
<p>[2] Die Frage, auf welcher Analyseebene (Individual- oder Aggregatebene) Teile der Untersuchungen letztlich durchgeführt wurden, kann ich nicht beantworten. Eine Nachfrage beim Institut für Demoskopie Allensbach für die ACTA-Daten ergab, dass diese in Verbindung mit einer Software namens mediMACH als Individualdaten bezogen werden können. Inwieweit dann die Analysen, etwa zu den Faktoren der Nutzungsintensität von Tageszeitungen und von Nachrichtensites, diese Individualdaten nutzen, ist mir nicht klar geworden.</p>
<p><strong>Literatur</strong></p>
<p>Diekmann, Andreas, 2004: Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Hamburg: Rowohlt.</p>
<p>Fahrmeir, Ludwig, 2001: Statistik. Der Weg zur Datenanalyse. Berlin [u.a.]: Springer.</p>
<p>Fahrmeir, Ludwig, Thomas Kneib, und Stefan Lang, 2007: Regression: Modelle, Methoden und Anwendungen. Berlin, Heidelberg: Springer.</p>
<p>Haller, Heiko, und Stefan Kraus, 2002: Misinterpretations of significance: A problem students share with their teachers?, Methods of Psychological Research Online 7: 1-20.</p>
<p>Kolo, Castulus, und Robin Meyer-Lucht, 2007: Erosion der Intensivleserschaft. Eine Zeitreihenanalyse zum Konkurrenzverhältnis von Tageszeitungen und Nachrichtensites, Rundfunk und Fernsehen 55: 513-533.</p>
<p>R Development Core Team, 2008: R: A language and environment for statistical computing &lt;http://www.R-project.org&gt;. Wien: R Foundation for Statistical Computing.</p>
<p>Sachs, Lothar, und Jürgen Hedderich, 2006: Angewandte Statistik: Methodensammlung mit R ; mit 180 Tabellen. Berlin u.a.: Springer.</p>
<p>Smithson, Michael, und Jay Verkuilen, 2006: A better lemon squeezer? Maximum-likelihood regression with beta-distributed dependent variables, Psychological Methods 11: 54-71.</p>
<p><strong>Anhang</strong></p>
<p>Der nachfolgende R-Code (R Development Core Team 2008) repliziert einen Teil der Analysen der in Abbildung 1 (oberste Regressionslinie) auf Seite 518 vorgestellten Befunde.<br />
<code>## Anteil Intensivleser (ueberregional) in Prozent<br />
y &lt;- c(15.0, 13.4, 13.6, 12.9, 11.7, 12.1)<br />
## Historisches Jahr<br />
jahr &lt;- c(2001:2006)<br />
## Schaetzen des Regressionsmodells<br />
summary(fit  &lt;- lm(y ~ jahr))<br />
## Neue Daten fuer Vorhersage erzeugen, Jahr 0 sowie den Zeitraum<br />
## von 2006 bis 2030<br />
vorhersage &lt;- data.frame(jahr = c(0,2006:2030))<br />
## Vorhersage ermitteln<br />
predict(fit, vorhersage)</code></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/10/27/wenn-statistik-irritiert-%e2%80%93-methodische-anmerkungen-zum-beitrag-erosion-der-intensivleserschaft-in-der-mk-42007/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Impressionen aus Vancouver vom 8. C2 Colloquium</title>
		<link>http://blog.berndweiss.net/2008/05/14/impressionen-aus-vancouver-vom-8-c2-colloquium/</link>
		<comments>http://blog.berndweiss.net/2008/05/14/impressionen-aus-vancouver-vom-8-c2-colloquium/#comments</comments>
		<pubDate>Wed, 14 May 2008 05:59:09 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Daten]]></category>
		<category><![CDATA[Soziologie]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Campbell Collaboration]]></category>
		<category><![CDATA[Meta-Analyse]]></category>
		<category><![CDATA[Regression]]></category>
		<category><![CDATA[Schulabsentismus]]></category>
		<category><![CDATA[Vancouver]]></category>

		<guid isPermaLink="false">http://www.quantisozblog.de/?p=144</guid>
		<description><![CDATA[Während Deutschland einen Schön-Wetterrekord nach dem anderen ausruft, befinde ich mich gerade im nassen und eher kühlen Vancouver, um am &#8220;8th Annual International Campbell Collaboration Colloquium&#8221; teilzunehmen. Das Motto der Veranstaltung lautet &#8220;Speaking Truth to Power: Evidence for Decisions in Education, Social Welfare, and Criminal Justice&#8221;. Es geht also im weitesten Sinne darum, soziale und [...]]]></description>
			<content:encoded><![CDATA[<p>Während Deutschland einen Schön-Wetterrekord nach dem anderen ausruft, befinde ich mich gerade im nassen und eher kühlen Vancouver, um am &#8220;<a href="https://www.campbellcolloquium.org/" target="_blank">8th Annual International Campbell Collaboration Colloquium</a>&#8221; teilzunehmen. Das Motto der Veranstaltung lautet &#8220;Speaking Truth to Power: Evidence for Decisions in Education, Social Welfare, and Criminal Justice&#8221;. Es geht also im weitesten Sinne darum, soziale und politische Maßnahmen auf eine empirische Basis zu stellen &#8212; im Sinne von <a href="http://www.pflegewiki.de/wiki/Evidence_based_practice" target="_blank">Evidence Based Practice (was man nicht immer gut heißen muss)</a>.</p>
<p><span id="more-144"></span></p>
<p>Meine persönliche Motivation nach Vancouver zu kommen, bestand zum einen in der Präsentation einiger  Dissertationsbefunde. Mein methodisch orientierter Vortrag hat an einem Beispiel aus der Schulabsentismusforschung die (möglichen) Unterschiede zwischen Meta-Analysen auf Grundlage von Aggregatdaten (hier: odds ratios) sowie von Individualdaten thematisiert.</p>
<p>Meta-Analysen haben das Ziel, den empirischen Forschungsstand in einem bestimmten Bereich oder zu einer bestimmten Fragestellung zusammenzufassen. Zusammen mit Michael Wagner habe ich beispielsweise eine Forschungssynthese erstellt, die der Frage nach dem erreichten Forschungsstand in der &#8220;Scheidungsursachenforschung&#8221; nachging &#8212; oder kurz gefasst: den Risikofaktoren der Ehescheidung. Es gibt eine Menge empirischer Untersuchungen in diesem Forschungsfeld, auf europäischer Ebene haben wir etwa 120 Arbeiten sichten können (Wagner/Weiß 2006). In dieser Situation den Forschungsstand qualitativ-beschreibend erfassen zu wollen, ist (fast) ein Ding der Unmöglichkeit. Also bestand unsere Aufgabe darin, in einer Art von Inhaltsanalyse alle empirischen Befunde aus den einzelnen Artikeln herauszusuchen und sie zusammen mit anderen Informationen in eine Datenbank einzutragen. Die Einträge in der Datenbank wiederum konnten dann statistisch analysiert werden. Diese empirischen Befunde waren in unserem Fall Regressionskoeffizienten aus ereignisanalytischen Modellen. Weil diese Statistiken das Trennungsrisiko von bestimmten Personengruppen beschreiben (etwa von Frauen oder Personen, die zum Zeitpunkt der Eheschließung unter 21 Jahren alt waren), lassen sie sich auch als Aggregatdaten bezeichnen.[1] In den erwähnten Regressionsmodellen finden sich gewöhnlich mehrere dieser Regressionskoeffizienten und sie haben (teilweise) die unangenehme Angewohnheit, &#8220;miteinander zu reagieren&#8221; (eine verständlichere Formulierung fällt mir nicht ein). Im Modell von Forscherin A befinden sich Koeffizienten der Merkmale X1, X2 und X3, während Forscher B zwar auch die Koeffizienten für X1 und X3 ermittelt hat, doch er hat X2 weggelassen und dafür X4 in sein Modell aufgenommen. Beide haben also X1 und X2 untersucht, doch die Gelehrten (Brüderl 2004; Wagner/Weiß 2004) &#8220;streiten&#8221; sich noch darüber, ob sich die Befunde zu X1 und X2 einfach in einer Meta-Analyse zusammenfassen lassen, obgleich sie eigentlich nicht miteinander vergleichbar sind. Jetzt kommen die Individualdaten ins Spiel: Wenn ich die Originaldaten habe, nicht länger nur die publizierten Studienbefunde, dann kann ich (a) meine eigenen Aggregatdaten produzieren und (b) auf Grundlage der Individualdaten Modelle schätzen und dann die Ergebnisse von (a) und (b) miteinander vergleichen. Genau das habe ich mit Datensätzen zum Schulschwänzen gemacht. Um genau zu sein, habe ich mich der Frage gewidmet, ob Jugendliche mit Migrationshintergrund häufiger die Schule schwänzen als deutsche Jugendliche. Das methodische Ergebnis meiner Untersuchungen lautet, dass auf Grundlage von Aggregatdaten sämtliche Kennziffern zur Erfassung der statistischen Unsicherheit (Standardfehler, Zwischenstudienvarianz) unterschätzt und der eigentliche  Zusammenhang von Schulschwänzen und Migrationshintergrund überschätzt wird &#8212; das gilt nur für meinen spezifischen Datensatz, ich habe also eine Fallstudie durchgeführt. Das war &#8212; sehr kurz gefasst &#8212; das Thema (beziehungsweise das Problem) meines Vortrags.</p>
<p>Meine persönliche Motivation bestand des Weiteren darin, mit Forschenden in Kontakt zu kommen, die sich mit ähnlichen Fragestellungen befassen. So gabe es etwa eine Veranstaltung &#8220;Complexities in Meta-analysis&#8221; in der uns zwar in 90 Minuten 5 Vorträge um die Ohren gehauen wurden, die aber mehr als spannend waren. Federführend war <a href=" http://www.coe.fsu.edu/becker/" target="_blank">Betsy J. Becker</a>, die drei Präsentationen gegeben hat, die beiden anderen wurden von Ihren Studentinnen (Soyeon Ahn und Ying Zhang) bestritten. Tatsächlich thematisierte einer ihrer Vorträge auch mein Problem mit  der Meta-Analyse von Regressionskoeffizienten.  Sie hat ihre Ausführungen auf das klassische lineare Modell bezogen und schlägt vor, die Koeffizienten in &#8220;semi-partial correlations&#8221; umzuwandeln und diese dann zu synthetisieren. Ich weiß noch nicht, ob mich das überzeugt; auf jeden Fall werde ich mir ihre Artikel zu diesem Thema genau angucken. Meine Idee, sich dem Problem mit einer Simulation zu nähern, konterte sich locker mit dem Hinweis, dass einer ihrer Studenten sich im Rahmen seiner &#8220;doctoral thesis&#8221; schon damit befassen würde.</p>
<p>Heute (Dienstag) habe ich mir unter anderem einen Vortrag von <a href="http://polisci.fsu.edu/people/faculty/block.htm" target="_blank">Ray Block</a> angehört, der zusammen mit Betsy J. Becker ein Projekt zur Messung von politischem Interesse bearbeitet. Titel seines Vortrags war &#8220;Be Specific!&#8221; How Item Specifity can Influence Self-Reported Levels of Political Interest&#8221;. Seine Ausführungen haben sich unter anderem mit dem zeitlichen Wandel des politischen Interesses (in den USA) befasst und vor allem der Frage, inwieweit beobachtbare Veränderungen tatsächlich sozialen Phänomenen geschuldet sind oder nicht eher (unbeabsichtigte) Methodeneffekte (Platzierung der Items, Anzahl der Antwortkategorien) sind. Der Gehalt an Meta-Analyse war gering, doch der Vortrag war gut.</p>
<p>Erwähnenswert ist schließlich noch die Präsentation von <a href="http://www.luc.edu/education/about_faculty_pigott.shtml" target="_blank">Therese Pigott</a>, Meng-Jia und Ryan Williams, die über &#8220;Methods of synthesizing regression results&#8221; gesprochen haben. Ja, das Thema kam nun schon mehrfach vor&#8230; Die Schwierigkeit mit der Meta-Analyse von Regressionskoeffizienten ist, wie oben erläutert, dass sie verschiedenen Modellen entstammen, in denen für unterschiedliche Variablensets kontrolliert wurde (X1,X2,X3 vs X1,X2,X4). Pigott et al. haben nun die Idee gehabt, das als ein &#8220;missing data&#8221;-Problem aufzufassen. Forscherin A hat nicht für X4 kontrolliert und Forscher B nicht für X3. Auf Grundlage einer Korrelationsmatrix (die man leider auch eher selten in den Publikationen antrifft) simulieren sie entsprechende Individualdatensätze und wenden dann typische Imputationsverfahren an. Anschließend lassen sich alle fehlenden Koeffizienten schätzen und können anschließend in die Meta-Analyse eingehen. Soweit die Theorie. Ryan war so nett, mir nur etwa 58 Minuten nach ihrem Vortrag ihr paper zuzuschicken. Doch das kann ich mir erst in Köln genauer angucken.</p>
<p>Außerdem könnte ich noch von einem sehr unterhaltsamen Vortrag von <a href="http://www.oise.utoronto.ca/depts/tps/levin.html" target="_blank">Ben Levin</a> berichten, der über &#8220;Evidence for Decision-Making in Education&#8221; gesprochen hat. Es ging viel um &#8220;knowledge mobilization&#8221; und gegen Ende kam mehrfach der Hinweis auf die Nützlichkeit von Web2.0-Techniken für die Forschung, die Forschenden und die Vermittlung von Forschung. Mehr gibt es <a href="http://www.oise.utoronto.ca/rspe/" target="_blank">hier</a>.</p>
<p><em><br />
</em></p>
<p>[1] Um genau zu sein, stammt der Begriff aus dem medizinischen Zweig der Meta-Analyse und dort ist von &#8220;aggregate patient data&#8221; die Rede. Ich verwende &#8220;aggregate person data&#8221;, kurz APD.</p>
<p><strong>Literatur</strong></p>
<p>Josef Brüderl, 2004: Meta-Analyse in der Soziologie: Bilanz der deutschen Scheidungsursachenforschung oder &#8220;statistischer Fruchtsalat&#8221;?, Zeitschrift für Soziologie 33: 84-86.</p>
<p>Wagner, Michael, und Bernd Weiß, 2004: Die Bilanz der Scheidungsforschung bleibt eine Bilanz. Eine Antwort auf Josef Brüderl. Zeitschrift für Soziologie 33: 87-89.</p>
<p>Wagner, Michael, und Bernd Weiß, 2006: On the Variation of divorce risks in Europe: Findings from a meta-analysis of European longitudinal studies. In: European Sociological Review 22: 483-500</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2008/05/14/impressionen-aus-vancouver-vom-8-c2-colloquium/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
