Archive for the ‘Software’ Category
URlaubsberichte auf “Alles was lebt”
(Muss ja nicht immer alles über Twitter laufen…)
Auf den Scienceblogs berichtet Emanuel Heitlinger auf seinem Blog “Alles was lebt” über seinen 3-wöchigen R-Kurs (anders formuliert: URlaub
). Der Kurs wird von Mick Crawley geleitet, der u.a. “The R Book” geschrieben hat. Mit bewundernswerter Disziplin macht Emanuel sich seine Notizen und veröffentlich diese als PDF sowie als R+Sweave-Quelldatei (um den R-Code nachvollziehen zu können). Bislang wurden u.a. die folgenden Themen behandelt: Ancova und ANOVA sowie das (lineare) Regressionsmodelle, m.a.W.: das allgemeine lineare Modell. Read the rest of this entry »
Kleines Update meiner Folien “(Sozial-)Wissenschaftliches Publizieren mit LaTeX”
Es gibt ein kleines Update meiner Folien “(Sozial-)Wissenschaftliches Publizieren mit LaTeX“. Neu sind u.a. 2-3 Folien zum Umgang mit Stata-Tabellen.
Call for Papers: Finding Thetas in Europe – Conference on Applied Bayesian Statistics and MCMC Methods in the Social Sciences, 08-09 April 2010, University of Mannheim
We are pleased to announce the conference “Finding Thetas in Europe – Applied Bayesian Statistics and MCMC Methods in the Social Sciences” at the University of Mannheim, Germany, from 8th to 9th April 2010. This interdisciplinary conference is organized by young scholars from the University of Cologne and the University of Mannheim. It intends to gather young social scientists from Europe who apply Bayesian and MCMC methods in their research.
Das WeissWiki als Sammlung (überwiegend) technischer Beiträge zur empirische Sozialforschung
Blogs eignen sich nur bedingt, wenn es um die Verschriftlichung des eigenen Wissens geht. Daher habe ich (vor allem für mich selbst) ein Wiki eingerichtet, das eine Sammlung von Notizen enthält, die mehr oder weniger etwas mit dem Bereich “empirische Sozialforschung” zu tun haben. Aktuell finden sich dort etwa Tipps für Studierende, die eine Abschlussarbeit schreiben wollen. Weitere Themengebiete sind LaTeX, R, JAGS, Emacs… Da es ein Wiki ist, steht es jedem/r frei, meine Ausführungen zu ändern (zu verbessern).
(Sozial-)Wissenschaftliches Publizieren mit LaTeX
Kürzlich habe ich eine Einführung in das Textsatzsystem LaTeX gehalten. Die Zuhörerschaft bestand überwiegend aus empirisch arbeitenden Sozialwissenschaftlern, insofern habe ich relativ viel Wert auf Graphiken sowie Tabellensatz (inkl. “Signifikanzsternchen”) gelegt. Für Interessierte stehen die Folien nachfolgend zum Herunterladen bereit.
- (Sozial-)Wissenschaftliches Publizieren mit LaTeX (farbig)
- (Sozial-)Wissenschaftliches Publizieren mit LaTeX (einfarbig, Druckfassung)
Meine drei Prinzipien der Datenanalyse oder: Alle Macht dem Code
Einführende Worte
Im nachfolgenden Text versuche ich relativ einfach und nicht auf Fachartikel-Niveau die für mich relevanten Punkte der statistischen Datenanalyse darzulegen. Die Idee zu einem solchen Blogbeitrag besteht schon länger und es gab auch schon Textfragmente. Die Motivation, den Artikel fertig zu stellen, habe ich durch den Beitrag “Ich plotte – also bin ich” auf dem Blog “Hinterm Mond gleich links” erhalten. Die dort sowohl im Artikel als auch in den Kommentaren vorgebrachten Einstellungen provozieren den Puristen in mir. Konkret ging es um das Nachbearbeiten einer Grafik, das heißt der Visualisierung von Daten. Dort ist dann von “nachträglich im Bild [d.h. der Grafik, BW] rumzupfuschen” oder “Diagramme meistens in Corel Draw” nachbauen die Rede. Der Pragmatiker (das ist der Gegenspieler des Puristen, s.o) in mir weiß natürlich auch, dass es Situationen geben kann, wo es zu einem solchen Vorgehen keine Alternative gibt (1 Stunde vor einer deadline o.ä.). Insofern wird nachfolgend ein idealisiertes Vorgehen beschrieben, dem auch ich nicht immer vollständig entsprechen kann und das natürlich über meine Kritik an “Ich plotte – also bin ich” weit hinausgeht.
Folien meiner Stata-Einführung verfügbar
Vor einiger Zeit habe ich am GESIS-ZA Zentralarchiv für Empirische Sozialforschung eine kurze Einführung in Stata gegeben (PDF: “Eine Einführung in das Statistikpaket Stata”, ado-File), da sich zeigt, dass die Daten-NutzerInnen verstärkt Stata-Datensätze nachfragen.
Themenschwerpunkt: Tücken und Techniken der empirischen Sozialforschung
Welche roten Fäden durchziehen dieses Weblog? Themenschwerpunkte dienen der kommentierten Zusammenfassung der aus meiner Sicht wichtigsten Beiträge.
Unter dieser Rubrik werden zumeist Detailprobleme aus dem weiten Feld der empirischen Sozialforschung aufgegriffen. So mache ich mir beispielsweise “Spontane und eher kritische Gedanken zum Scholarz.survey” — doch es gilt auch die anschließenden Reaktionen der von mir kritisierten Befragung zu beachten.
Buch “Introduction to Data Technologies” von Paul Murrell unter CC Lizenz verfügbar
Paul Murrell hat ein unter einer CC Lizenz stehendes, knapp 400 Seiten umfassendes Buch mit dem Titel “Introduction to Data Technologies” veröffentlicht (sowohl als HTML als auch als PDF). Er schreibt zu seinem Anliegen:
The basic premise of this book is that scientists are required to perform many tasks with data other than statistical analyses. A lot of time and effort is usually invested in getting data ready for analysis: collecting the data, storing the data, transforming and subsetting the data, and transferring the data between different operating systems and applications.
Ein Tool zur automatischen Erfassung von blog posts sucht…
…testwillige Personen. Dazu kan man auf der Political Methodology E-Mail List den folgenden Aufruf von Stuart Shulman lesen:
Some of you know I have a new penchant for tool-building. Well, the latest creation of the QDAP lab is a blog scraping tool. The tool is designed to allow you to set up accounts to automatically capture blog posts on one or several blogs and to archive the data in a plain text format “ready-to-be-coded” inside QDAP’s Coding Analysis Toolkit.

