<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule">

<channel>
	<title>blog.berndweiss.net &#187; Bayes</title>
	<atom:link href="http://blog.berndweiss.net/tag/bayes/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.berndweiss.net</link>
	<description>Unter anderem mit diesen Themen: Quantitative Soziologie, Statistik, R &#38; LaTeX</description>
	<lastBuildDate>Sun, 29 Aug 2010 14:28:54 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
<creativeCommons:license>http://creativecommons.org/licenses/by-nc-sa/3.0/de/</creativeCommons:license>		<item>
		<title>Sammelsurium interessanter Dinge (I)</title>
		<link>http://blog.berndweiss.net/2007/10/04/sammelsurium-interessanter-dinge-i/</link>
		<comments>http://blog.berndweiss.net/2007/10/04/sammelsurium-interessanter-dinge-i/#comments</comments>
		<pubDate>Thu, 04 Oct 2007 08:12:07 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Daten]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Soziologie]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Bayes]]></category>
		<category><![CDATA[MCMC]]></category>
		<category><![CDATA[R]]></category>
		<category><![CDATA[Unsicherheit]]></category>

		<guid isPermaLink="false">http://www.quantisozblog.de/2007/10/04/sammelsurium-interessanter-dinge-i/</guid>
		<description><![CDATA[Während sich mcsamp um den Verstand und meinen Hauptspeicher &#8220;samplet&#8221;[1], einige Hinweise auf Interessantes der letzten Woche(n): Eine gelungene Zusammenfassung von Sutton und Higgins zum aktuellen (Methoden)Stand der Meta-Analyse aus (bio/medizin)statistischer Sicht: &#8220;Recent developments in meta-analysis&#8220;. Wie zu erwarten, werden Meta-Analysen auf Grundlage von individual patient data eine immer gewichtigere Rolle spielen. Die Ankündigung der [...]]]></description>
			<content:encoded><![CDATA[<p>Während sich <a href="http://cran.r-project.org/doc/packages/arm.pdf" target="_blank">mcsamp</a> um den Verstand und meinen Hauptspeicher &#8220;samplet&#8221;[1], einige Hinweise auf Interessantes der letzten Woche(n):</p>
<ol>
<li>Eine gelungene Zusammenfassung von Sutton und Higgins zum aktuellen (Methoden)Stand  der Meta-Analyse aus (bio/medizin)statistischer Sicht: &#8220;<a href="http://www3.interscience.wiley.com/cgi-bin/abstract/114282441/ABSTRACT" target="_blank">Recent developments in meta-analysis</a>&#8220;. Wie zu erwarten, werden Meta-Analysen auf Grundlage von <em>individual patient data </em>eine immer gewichtigere Rolle spielen.</li>
<li>Die Ankündigung der Tagung &#8220;<a href="http://www.unibw.de/soziologie/statistik2007" target="_blank">Uneindeutigkeit als Herausforderung. Risiko, amtliche Statistik und Wahrscheinlichkeit</a>&#8221; klingt spannend und müsste ich nicht meine Diss zu einem (hoffentlich) guten Ende bringen, hätte es mich in den Süden der Republik verschlagen (ich hätte vor allem gerne die Vorträge von Götz Rohwer,  Friedrich Leisch und Thomas Augustin angeschaut). Definitiv ein Thema, dem ich mich nach der Diss widmen werde.</li>
<li>Unabhängig von einander und mit unterschiedlicher Stoßrichtung machen sich <a href="http://www.iq.harvard.edu/blog/sss/archives/2007/10/the_changing_ev.shtml" target="_blank">Gary King</a> sowie <a href="http://www.forschung-und-lehre.de/cms/index.php?menu_id=6&amp;nur_dieser_inhalt_id=2577" target="_blank">Rainer Böhme und Andreas Pfitzmann</a> (via <a href="http://www.bamberg-gewinnt.de/wordpress/archives/837" target="_blank">Bamblog</a>) Gedanken über die zukünftige(n) Datengrundlage(n) in den Sozialwissenschaften.</li>
<li>R ist  in der Version 2.6.0 erschienen. Ich musste lernen, dass die Deinstallation der vorherige Version von R (2.5.1) und das Behalten der alten R-Pakete zu <a href="http://tolstoy.newcastle.edu.au/R/e2/help/07/10/27085.html" target="_blank">Konflikten</a> führen kann. Aber es gibt wie immer einen <a href="http://tolstoy.newcastle.edu.au/R/e2/help/07/10/27087.html" target="_blank">Ausweg</a>. Oder sogar noch einen <a href="http://tolstoy.newcastle.edu.au/R/e2/help/07/10/27108.html" target="_blank">besseren</a>.</li>
</ol>
<p><span id="more-48"></span></p>
<p>[1] Hat nur 108 Minuten gedauert.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2007/10/04/sammelsurium-interessanter-dinge-i/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Notizen zur Anwendung Bayesianischer Methoden in der Soziologie</title>
		<link>http://blog.berndweiss.net/2007/08/26/notizen-zur-anwendung-bayesianischer-methoden-in-der-soziologie/</link>
		<comments>http://blog.berndweiss.net/2007/08/26/notizen-zur-anwendung-bayesianischer-methoden-in-der-soziologie/#comments</comments>
		<pubDate>Sun, 26 Aug 2007 15:29:15 +0000</pubDate>
		<dc:creator>Bernd Weiss</dc:creator>
				<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Bayes]]></category>
		<category><![CDATA[Bayesianische Statistik]]></category>
		<category><![CDATA[OpenBUGS]]></category>
		<category><![CDATA[Soziologie]]></category>
		<category><![CDATA[WinBUGS]]></category>

		<guid isPermaLink="false">http://www.quantisozblog.de/2007/08/26/notizen-zur-anwendung-bayesianischer-methoden-in-der-soziologie/</guid>
		<description><![CDATA[Vorbemerkung Konkreter Anlass für die nachfolgenden Notizen ist ein Artikel (s.u.) im Economist, den ich erst fast überlesen hätte und der mich dann doch länger beschäftigt hat als ich dachte. Über kritische Anmerkungen oder auftretende Verständnisfragen würde ich mich freuen. Klimamodelle, Soziologie und Unsicherheit Die Diskussion um Anwendungen/Probleme/Vorteile Bayesianischer Statistik findet sich inzwischen auch in [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Vorbemerkung </strong></p>
<p>Konkreter Anlass für die nachfolgenden Notizen ist ein Artikel (s.u.) im <em>Economist</em>, den ich erst fast überlesen hätte und der mich dann doch länger beschäftigt hat als ich dachte. Über kritische Anmerkungen oder auftretende Verständnisfragen würde ich mich freuen.</p>
<p><strong>Klimamodelle, Soziologie und  Unsicherheit</strong></p>
<p>Die Diskussion um Anwendungen/Probleme/Vorteile <a href="http://en.wikipedia.org/wiki/Bayesian_statistics" target="_blank">Bayesianischer Statistik</a> findet sich inzwischen auch in Magazinen wie <em>The Economist</em> wieder. Der mit <a href="http://www.economist.com/science/displaystory.cfm?story_id=9645336" target="_blank"><em>Gambling on tomorrow</em></a> überschriebene Artikel erläutert die &#8220;Schwierigkeiten&#8221;, die sich aus einer Bayesianischen Perspektive mit der Modellierung des Klimas ergeben [1]. Die Autoren heben vor allem auf den &#8220;problematischen&#8221; Umgang mit so genannten Prior-Informationen ab und den Konsequenzen, die sich für die Vorhersagen von Klimaphänomenen ergeben. In verschiedenen Simulationsläufen lassen sich diese Prior-Annahmen variieren:</p>
<blockquote><p>&#8220;But models are not given single runs. Since the future is uncertain, they are run thousands of times, with different values for the parameters, to produce a range of possible outcomes. The outcomes are assumed to cluster around the most probable version of the future. [...] The particular range of values chosen for a parameter is an example of a Bayesian prior assumption, since it is derived from actual experience of how the climate behaves—and may thus be modified in the light of experience. But the way you pick the individual values to plug into the model can cause trouble.&#8221;[2]</p></blockquote>
<p><span id="more-31"></span></p>
<p>Die Vorhersage von Prozessen/Ereignissen setzt natürlich das Verstehen der kausalen Mechanismen  voraus. Vorhersagen werden in der Soziologie nur selten vorgenommen, meist ist man mit dem Verstehen der sozialer Prozesse ausreichend beschäftigt. Implizit wird mit dem häufig praktizierten Schluss von der Stichprobe auf die Grundgesamtheit natürlich auch eine (Art von) Vorhersage getroffen. Was der oben zitierte Artikel insgesamt etwas randständig behandelt, ist eines der zentralen Motive angemessen zu betonen, sich mit bayesianischen Methoden zu befassen, nämlich dem angemessenen Umgang mit Unsicherheit. Jede Vorhersage  (&#8220;Since the future is uncertain&#8221;), jede soziologische Inferenz ist mit Unsicherheit  behaftet.</p>
<p><strong>Kritische Anmerkungen zur gängigen Praxis </strong></p>
<p>Bislang gründet sich die empirische Soziologie auf einem frequentistischen Konzept von (Inferenz)Statistik. Die frequentistische Statistik definiert Wahrscheinlichkeit als die relative Häufigkeit (&#8220;frequentistisch&#8221;) einer großen Zahl von Zufallsexperimenten. Je mehr Stichproben aus ein und derselben Grundgesamtheit gezogen werden können, desto besser (mit einer größeren Wahrscheinlichkeit) lässt sich der gesuchte Populationsparameter schätzen. Diese Situation ist hypothetisch, da zumeist nur eine einzige Stichprobe gezogen werden kann. Auf Grundlage aller (hypothetisch unendlich vielen) Stichprobenziehungen lässt sich eine (hypothetisch exakte) Schätzung des wahren/unveränderlichen/fixen Populationsparameters vornehmen. Doch wie sicher können wir auf Grundlage unserer Modellannahmen eigentlich sein, den &#8220;Entstehungsprozess&#8221; des Parameters angemessen beschrieben zu haben? Wäre nicht ein Ansatz fairer/transparenter, der ausdrücklich solche (subjektiven, von mir aus auch theortisch fundierten) Modellannahmen bei seinen Parameterschätzungen und vor allem bei den Maßen zur Reliabilität dieser Schätzungen (Fehlervarianz) berücksichtigt?</p>
<p>In der Bayesianischen Statistik wird dem Parameter vorab eine Prior-Wahrscheinlichkeit [3] zugewiesen. Der gesamte Modellierungsprozess setzt also, zumindest konzeptionell, bereits vor dem Vorliegen von Daten an, indem <em>a priori</em> Informationen über den Parameter bestimmt werden müssen. Formuliert (beziehungsweise formalisiert) werden diese so genannten Prior-Informationen in Form einer Wahrscheinlichkeitsverteilung. Prior-Informationen können als zusätzliche Datenpunkte interpretiert werden. Was sind die Konsequenzen? Liegt wenig empirisches Datenmaterial vor, dann beeinflussen Prior-Informationen die Parameterschätzungen stark. Ihr Einfluss sinkt mit zunehmenden Fallzahlen.</p>
<p>Wird einem Parameter aber eine Prior-Wahrscheinlichkeit zugewiesen, dann ist die Annahme schwierig, es gäbe eine unbekannte Konstante, die (mit Aufwand zwar) beliebig genau geschätzt werden kann. Mit dem Zuweisen eines Wahrscheinlichkeitsmodell wird die (subjektive) Ungewissheit über den &#8220;wahren&#8221; Wert zum Ausdruck gebracht. Beide Ansätze unterscheiden sich jedoch letztlich nicht darin, einen einzigen, festen Parameter anzunehmen.[4]</p>
<p>Wenn der Gedanke, eine Prior-Wahrscheinlichkeit zu formulieren, erst einmal akzeptabel erscheint,  eröffnen sich die Vorzüge dieses Ansatzes: Einer der Vorteile Bayesianischen Denkens in der Statistik ist die Tatsache, dass sich konkrete Wahrscheinlichkeitsaussagen über die Zuverlässigkeit der Parameterschätzungen treffen lassen. Diese Wahrscheinlichkeit wird als Posterior-Wahrscheinlichkeit bezeichnet. Nach einigen mentalen Verrenkungen, das Wesen der <em>statistischen Signifikanz</em> und die Frage nach der H0 vs. H1 im Innersten erfassen zu können, habe ich diesen Umstand schätzen gelernt. Außerdem werden die Schätzungen <em>en passant</em> noch für die oben beschriebene Unsicherheit korrigiert.</p>
<p><strong>Warum also nicht?</strong></p>
<p>Warum befasst sich die Soziologie nicht mit einem solchen Ansatz? Fabio Rojas hat sich auf <a href="http://orgtheory.wordpress.com/2007/06/20/bayes-or-bust/" target="_blank">orgtheory.net</a> dieser Frage gewidmet &#8212; leider nicht der Frage, warum es für die Soziologie Sinn machen sollte, sich mit Bayes zu befassen. Folgende Gründe, ergänzt um eigene Überlegungen lassen sich aufzählen:</p>
<ol>
<li>Mangelnde Ausbildung und damit einhergehende Ignoranz neuen Verfahren gegenüber.</li>
<li>Geringe Akzeptanz seitens der <em>peers</em> in den Begutachtungsverfahren. Was natürlich den ersten Punkt verstärkt. Gleichzeitig wird dieser Ausbildungsmangel aber auch keine fähigen Gutachter hervorbringen &#8212; ein Teufelskreis.</li>
<li>Es gibt (bislang) keine leicht verständliche Software. Verbreitet sind Programme wie <a href="http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml" target="_blank">WinBUGS</a> oder <a href="http://mathstat.helsinki.fi/openbugs/" target="_blank">OpenBUGS</a>, die wenig massenkompatibel sind . In R gibt es inzwischen <a href="http://cran.r-project.org/src/contrib/Views/Bayesian.html" target="_blank">einige Pakete</a>, die Erleichterungen bringen, aber das setzt natürlich den Umgang mit R voraus. Hinzu kommt, dass die Schätzverfahren (<a href="http://en.wikipedia.org/wiki/Markov_chain_Monte_Carlo" target="_blank">MCMC</a>), die solche Programme üblicherweise verwenden, alles andere als eingängig sind.</li>
<li>Fehlendes Marketing der Bayesianer und hier mach Rojas folgenden Vorschlag: &#8220;Bayesians simply haven’t packaged it right for mass consumption yet.  Suggested motto &#8211; &#8216;Confidence intervals that you can understand!&#8217; I’d buy it&#8221;.</li>
<li>Im vierten Punkt wird auf die so genannten <em>credibility intervals</em> angespielt, die üblicherweise &#8220;breiter&#8221; als Konfidenzintervalle sind. Was natürlich auch als &#8220;Nachteil&#8221; im Sinne fehlender statistischer Bedeutsamkeit und damit geringerer Veröffentlichungswahrscheinlichkeit verstanden werden kann (Stichwort <a href="http://en.wikipedia.org/wiki/Publication_bias" target="_blank">publication bias</a>).</li>
</ol>
<p><strong>Weiterführende Literatur </strong></p>
<ul>
<li>Eines der Standardwerke haben sicherlich Gelman et al. (2003) mit &#8220;<a href="http://www.stat.columbia.edu/~gelman/book/" target="_blank">Bayesian Data Analysis</a>&#8221; verfasst. Ist aber keine leichte Lektüre.</li>
<li>Von Scott M. Lynch ist kürzlich erst eine &#8220;<a href="http://www.princeton.edu/~slynch/bayesbook/bookinfo.html" target="_blank">Introduction to Applied Bayesian Statistics and Estimation for Social Scientists</a>&#8221;  erschienen.</li>
<li>&#8230; die Liste wird fortgesetzt.</li>
</ul>
<p><strong>Fußnoten</strong></p>
<p>[1]  Die Autoren haben aber auf jeden Fall Schwierigkeiten, die Begriffe &#8220;Wetter&#8221; und &#8220;Klima&#8221; sinnvoll voneinander abzugrenzen. Den Unterschied <a href="http://www.mpimet.mpg.de/presse/faqs/was-ist-der-unterschied-zwischen-wetter-und-klima.html" target="_blank">erklärt</a> zum Beispiel das Max-Planck-Institut für Meteorologie.</p>
<p>[2] Eine Bewertung der Zuverlässigkeit solcher Klimamodelle findet sich in dem gut lesbaren Artikel von Jouni Räisänen (2007) : &#8220;How reliable are climate models? &#8220;, <a href="http://www.blackwell-synergy.com/doi/ref/10.1111/j.1600-0870.2006.00211.x" target="_blank">Tellus A 59 (1), 2–29.</a></p>
<p>[3] Wie man zu diesen Prior-Annahmenkommt, ist eine eigene Geschichte. In den meisten Fälle werden so genannte nicht-informative Priors benutzt. Im Falle eines Regressionskoeffizienten würde das etwa bedeuten, dass man die Vorabannahme trifft, er sei mit N(0, 1e+06) normalverteilt. Das heißt man unterstellt einen Nulleffekt und eine riesige Streuung (= große Unsicherheit bezüglich des &#8220;wahren&#8221; Wertes). Andere Anwendungen verwenden uniforme Verteilungen.</p>
<p>[4] Es fehlt sicherlich noch eine genauere Erläuterung, was &#8220;subjektiv&#8221; heißt. Andrew Gelman spricht in einem seiner Beitrage zu &#8220;<a href="http://www.stat.columbia.edu/~cook/movabletype/archives/2004/10/bayes_and_poppe.html" target="_blank">Bayes and Popper</a>&#8221; auch von &#8220;objective Bayes&#8221; und erklärt das leider nur in wenigen Sätzen. In seinem Beitrag kommt auch die Falsifizierbarkeit von Theorien zur Sprache; hätte ich auch noch ansprechen können.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.berndweiss.net/2007/08/26/notizen-zur-anwendung-bayesianischer-methoden-in-der-soziologie/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
	</channel>
</rss>
