Abrunden der Zahlen Beschreibung Die Decke nimmt ein einzelnes numerisches Argument x und gibt einen numerischen Vektor zurück, der die kleinsten ganzen Zahlen enthält, die nicht kleiner als die entsprechenden Elemente von x sind. Der Boden nimmt ein einzelnes numerisches Argument x und gibt einen numerischen Vektor zurück, der die größten ganzen Zahlen enthält, die nicht größer als die entsprechenden Elemente von x sind. Trunc nimmt ein einzelnes numerisches Argument x und gibt einen numerischen Vektor zurück, der die ganzen Zahlen enthält, die durch das Abschneiden der Werte in x in Richtung 0 gebildet werden. Rund runden die Werte in seinem ersten Argument auf die angegebene Anzahl von Dezimalstellen (Standard 0). Signif rundet die Werte in seinem ersten Argument auf die angegebene Anzahl signifikanter Ziffern. Ein numerischer Vektor. Oder für runde und signif. Ein komplexer Vektor. Ganzzahl, die die Anzahl der Dezimalstellen (rund) oder signifikante Ziffern (signif) angibt. Negative Werte sind erlaubt (siehe lsquoDetailsrsquo). Argumente an Methoden weiterzugeben. Dies sind generische Funktionen: Methoden können für sie individuell oder über die Math-Gruppe generisch definiert werden. Beachten Sie, dass für die Abrundung einer 5, die IEC 60559 Standard erwartet wird, verwendet werden, lsquo gehen, um die sogar Ziffer rsquo. Daher ist die Runde (0,5) 0 und rund (-1,5) ist -2. Dies ist jedoch abhängig von den OS-Diensten und dem Repräsentationsfehler (da zB 0.15 nicht exakt dargestellt ist, gilt die Rundungsregel für die dargestellte Zahl und nicht für die gedruckte Nummer, und so kann (0.15, 1) entweder 0,1 oder 0,2 sein ). Rundung auf eine negative Anzahl von Ziffern bedeutet Rundung auf eine Macht von zehn, so z. B. Runde (x, Ziffern -2) Runden auf die nächsten hundert. Für signif sind die erkannten Werte der Ziffern 1. 22. und nicht fehlende Werte werden auf die nächstgelegene ganze Zahl in diesem Bereich gerundet. Komplexe Zahlen werden gerundet, um die angegebene Anzahl von Ziffern im größeren der Komponenten zu behalten. Jedes Element des Vektors ist einzeln abgerundet, im Gegensatz zum Drucken. Das sind alle primitive Funktionen. S4-Methoden Dies sind alle (intern) S4 generisch. Decke. Boden und Trunc sind Mitglieder der Math Gruppe Generika. Als S4-Generika hat trunc nur ein Argument. Runde und signif sind Mitglieder der Math2 Gruppe generisch. Die Realität der Computer-Arithmetik kann zu unerwarteten Ergebnissen führen, vor allem bei Boden und Decke. Zum Beispiel haben wir diesen Boden (log (x, base 8)) für x 8 ist 1. aber 0 wurde auf einer R-Plattform gesehen. Normalerweise ist es notwendig, eine Toleranz zu verwenden. Referenzen Becker, R. A. Chambers, J. M. und Wilks, A. R. (1988) Die neue S-Sprache. Wadsworth amp BrooksCole. NOTICE: Die IDRE Statistical Consulting Group wird die Website auf das WordPress CMS im Februar migrieren, um die Wartung und die Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Hilfe der Stat Consulting Group durch ein Geschenk Stata Datenanalyse Beispiele Trunkierte Regression Versionsinfo: Code für diese Seite wurde in Stata 12 getestet. Abgeschnittene Regression wird verwendet, um abhängige Variablen zu modellieren, für die einige der Beobachtungen werden aufgrund des Wertes der abhängigen Variablen nicht in die Analyse einbezogen. Bitte beachten Sie: Der Zweck dieser Seite ist es, zu zeigen, wie man verschiedene Datenanalysebefehle verwendet. Es deckt nicht alle Aspekte des Forschungsprozesses ab, den die Forscher erwarten werden. Insbesondere geht es nicht um die Datenreinigung und - prüfung, die Überprüfung von Annahmen, Modelldiagnosen oder potenziellen Folgeuntersuchungen. Beispiele für verkürzte Regression Beispiel 1. Eine Studie von Schülern in einem speziellen GATE (begabte und talentierte Bildung) Programm wünscht, die Leistung als Funktion der Sprachkenntnisse und der Art des Programms, in dem der Student derzeit eingeschrieben ist, zu modellieren. Ein wichtiges Anliegen ist, dass die Schüler eine Mindestleistung von 40 haben müssen, um das spezielle Programm zu betreten. So wird die Probe mit einer Erzählung von 40 abgeschnitten. Beispiel 2. Ein Forscher hat Daten für eine Probe von Amerikanern, deren Einkommen über der Armutsgrenze liegt. Daher wird der untere Teil der Einkommensverteilung abgeschnitten. Wenn der Forscher eine Probe von Amerikanern hatte, deren Einkommen bei oder unterhalb der Armutsgrenze lag, dann würde der obere Teil der Einkommensverteilung abgeschnitten werden. Mit anderen Worten, die Trunkierung ist ein Ergebnis der Stichprobe nur ein Teil der Verteilung der Ergebnisvariablen. Beschreibung der Daten Lets verfolgen Beispiel 1 von oben. Wir haben eine hypothetische Datendatei, truncreg. dta. Mit 178 Beobachtungen. Die Ergebnisvariable heißt achiv. Und die Sprache Test Score Variable heißt Langscore. Die Variable Prog ist eine kategorische Prädiktorvariable mit drei Ebenen, die die Art des Programms angibt, in dem die Schüler eingeschrieben wurden. Schauen wir uns die Daten an. Es ist immer eine gute Idee, mit beschreibenden Statistiken zu beginnen. Analysemethoden, die Sie vielleicht betrachten, ist eine Liste einiger Analysemethoden, die Sie möglicherweise angetroffen haben. Einige der aufgeführten Methoden sind recht vernünftig, während andere entweder aus dem Gefallen gefallen sind oder Einschränkungen haben. OLS Regression - Sie können diese Daten mit OLS Regression analysieren. OLS-Regression wird die Schätzungen der Koeffizienten nicht anpassen, um die Wirkung der Trunkierung der Probe bei 40 zu berücksichtigen, und die Koeffizienten können stark vorgespannt sein. Dies kann als Modellspezifikationsfehler konzipiert werden (Heckman, 1979). Abgeschnittene Regression - Abgestürzte Regression adressiert die Bias, die bei der Verwendung von OLS-Regression mit abgeschnittenen Daten eingeführt wird. Beachten Sie, dass bei abgeschnittener Regression die Varianz der Ergebnisvariablen gegenüber der nicht abgeschnittenen Verteilung reduziert wird. Auch wenn der untere Teil der Verteilung abgeschnitten ist, dann ist der Mittelwert der abgeschnittenen Variablen größer als der Mittelwert aus der nicht abgeschnittenen Variablen, wenn die Trunkierung von oben ist, wird der Mittelwert der abgeschnittenen Variablen kleiner als die nicht markierte Variable. Diese Arten von Modellen können auch als Heckman-Auswahlmodelle konzipiert werden, die verwendet werden, um die Auswahl der Selektionsvorspannung zu korrigieren. Zensierte Regression - Manchmal sind die Begriffe der Trunkierung und Zensur verwirrt. Mit zensierten Daten haben wir alle Beobachtungen, aber wir kennen nicht die wahren Werte von einigen von ihnen. Bei der Trunkierung werden einige der Beobachtungen wegen des Wertes der Ergebnisvariablen nicht in die Analyse einbezogen. Es wäre unangemessen, die Daten in unserem Beispiel mit einem zensierten Regressionsmodell zu analysieren. Abgestürzte Regression Im Folgenden verwenden wir den Befehl truncreg, um ein abgeschnittenes Regressionsmodell zu schätzen. Das i. Bevor prog anzeigt, dass es sich um eine Faktorvariable (d. H. Kategorische Variable) handelt und dass sie als eine Reihe von Indikatorvariablen in das Modell aufgenommen werden sollte. Die Option ll () im Befehl truncreg gibt den Wert an, an dem die linke Trunkierung stattfindet. Es gibt auch eine ul () - Option, um den Wert der richtigen Trunkierung anzugeben, der in diesem Beispiel nicht benötigt wurde. Die Ausgabe beginnt mit einer Notiz, die angibt, dass Null-Beobachtungen abgeschnitten wurden. Dies liegt daran, dass unsere Stichprobe keine Daten mit Werten von weniger als 40 für die Leistung enthielt. Auf die Note folgt das Iterationsprotokoll, das die Werte der Log-Likelihoods mit einem Modell abgibt, das keine Prädiktoren hat. Der letzte Wert im Protokoll ist der endgültige Wert der Log-Wahrscheinlichkeit und wird unten wiederholt. Die Header-Informationen werden als nächstes bereitgestellt. Auf der linken Seite sind die unteren und oberen Grenzen der Trunkierung und eine Wiederholung der endgültigen Log-Wahrscheinlichkeit. Auf der rechten Seite wird die Anzahl der beobachteten Beobachtungen (178) zusammen mit dem Wald-Chi-Quadrat mit drei Freiheitsgraden gegeben. Der Wald-Chi-Platz ist das, was du bekommen würdest, wenn du den Testbefehl nach der Schätzung des Modells benutzt hast, um zu testen, dass alle Koeffizienten null sind. Schließlich gibt es einen p-Wert für den Chi-Quadrat-Test. Insgesamt ist dieses Modell statistisch signifikant. In der Tabelle der Koeffizienten haben wir die verkürzten Regressionskoeffizienten, den Standardfehler der Koeffizienten, die Wald z-Tests (Koeffizienten) und den p-Wert, der jedem z-Test zugeordnet ist. Standardmäßig erhalten wir auch ein 95-Konfidenzintervall für die Koeffizienten. Mit der level () Option können Sie ein anderes Konfidenzintervall anfordern. Das Nebenstatistik-Sigma entspricht dem Standardfehler der Schätzung in der OLS-Regression. Der Wert von 8,76 kann mit der Standardabweichung der Leistung verglichen werden, die 8,96 betrug. Das zeigt eine bescheidene Reduktion. Die Ausgabe enthält auch eine Schätzung des Standardfehlers von Sigma sowie ein 95 Konfidenzintervall für diesen Wert. Das abgeschnittene Regressionsmodell, das die Leistung von Sprachwerten und Programmtypen voraussagte, war statistisch signifikant (chi-square 54.76, df 3, pWenn Sie verkürzte Regressionsmodelle vergleichen möchten, können Sie den Befehl estat ic ausgeben, um die Log-Wahrscheinlichkeit, AIC und BIC zu erhalten Die Truncreg-Ausgabe enthält weder einen R2 noch einen Pseudo-R 2. Sie können eine grobe Schätzung des Assoziationsgrades berechnen, indem sie mit dem vorhergesagten Wert korrelieren und das Ergebnis quadrieren. Der berechnete Wert von 0,31 ist eine grobe Schätzung von Die R2, die Sie in einer OLS-Regression finden würden. Die quadrierte Korrelation zwischen den beobachteten und vorhergesagten akademischen Eignungswerten beträgt etwa 0,31, was darauf hindeutet, dass diese Prädiktoren über 30 der Variabilität der Ergebnisvariablen entfielen. Die Betrachtung des Statas truncreg Befehls ist entworfen Um zu arbeiten, wenn die Trunkierung auf der Outcome-Variable im Modell ist. Es ist möglich, Proben, die auf einem oder mehreren Prädiktoren abgeschnitten sind, zu haben. Zum Beispiel ist die Modellierung College GPA als Funktion der High School GPA (HSGPA) und SAT Scores beinhaltet Eine Probe, die auf der Grundlage der Prädiktoren abgeschnitten wird, dh nur Schüler mit höheren HSGPA - und SAT-Scores werden in das College aufgenommen. Sie müssen vorsichtig sein, welcher Wert als Trunkierungswert verwendet wird, da er die Schätzung der Koeffizienten und Standardfehler beeinflusst. Im obigen Beispiel, wenn wir ll (39) anstelle von ll (40) verwendet hätten. Die Ergebnisse hätten etwas anders gewesen Es spielt keine Rolle, dass es keine Werte von 40 in unserer Probe gab. Referenzen Greene, W. H. (2003). Ökonometrische Analyse, Fünfte Auflage. Oberer Saddle River, NJ: Prentice Hall. Heckman, J. J. (1979). Beispielauswahl Bias als Spezifikationsfehler. Ökonometrie Band 47, Nr. 1, Seiten 153 - 161. Lange, J. S. (1997). Regressionsmodelle für kategorische und begrenzte abhängige Variablen. Tausend Eichen, CA: Salbei Publikationen. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.
No comments:
Post a Comment