Regression HD


Regressionsanalysen für
hochdimensionale Datensituationen

Paul Schmidt – freiberuflicher Statistiker

Meine Arbeit beginnt dort, wo andere nicht weiterkommen

Die Möglichkeit, immer mehr Daten speichern und bearbeiten zu können, macht es oft auch nötig, immer größere Regressionsmodelle zu schätzen. Situationen mit mehreren Millionen unbekannten Parametern sind längst keine Ausnahmen mehr, stellen jedoch sowohl für den Anwender als auch für die meisten statistischen Programmpakete ernsthafte Probleme dar.

Als ausgebildeter Statistiker habe ich mich auf die Bearbeitung solch hochdimensionaler Problemstellungen spezialisiert. Mit hauseigner Software bin ich in der Lage, riesige Regressionsmodelle auch ohne Supercomputer zu schätzen.

Vielseitig einsetzbar

Hochdimensionale Datensituationen kommen in vielen Bereichen vor: bei der Analyse von medizinischen Bildern, der Modellierung langer Zeitreihen oder Longitudinalstudien mit mehreren hunderttausend Versuchseinheiten – um nur einige Beispiele zu nennen.

Demzufolge trifft man solche Problemstellungen in vielen verschiedenen Disziplinen an: von Medizin über klassiche Naturwissenschaften bis hin zur Soziologie und den Wirtschaftswissenschaften.

Modernste Inferenzkonzepte

Die Kombination aus modernen MCMC-Algorithmen und iterativen Methoden für dünnbesetzte lineare Gleichungssysteme erlauben Inferenzaussagen in ungewöhnlich großen Situationen – mit nur geringen Hardware-Anforderungen.

Im Kern handelt es sich bei der Methode um strukturiert additive Regressionsmodelle. Sie erlauben neben der Einbindung räumlicher und zeitlicher Information auch die Schätzung nicht-parametrischer Effekte.

Die Vorzüge des verwendeten Bayesianischen Ansatzes: keine Korrektur für multiples Testen, eine intuitive Interpretation von Ergebnissen und die Möglichkeit, Vorwissen in die Schätzung mit einzubeziehen.

Strukturen erkennen

Grundvoraussetzung für eine erfolgreiche Anwendung ist die Betrachtung der Fragestellung als Regressionsproblem: eine oder mehrere Variablen haben einen potentiellen Einfluss auf eine Zielgröße.

Eine weitere wichtige Voraussetzung ist die mögliche Strukturierung von Regressionskoeffizienten. In den meisten Fällen sollte diese Voraussetzung erfüllt sein, im Zweifel liegt es aber in meinem Aufgabenspektrum, diese Frage zu beantworten.

Kontakt

Mehr über mich, meine Arbeit und mögliche Kosten erfahren Sie hier.

Sie haben eine Frage? Rufen Sie mich an (Mo. - Fr., 09:00 - 17:00 Uhr): +49 30 966 108 75. Oder schreiben Sie mir. Füllen Sie einfach das folgende Formular aus und ich werde mich so schnell wie möglich bei Ihnen melden.