Wednesday 1 November 2017

Przenoszenie średniej danych danych danych


Mam dane panelowe obejmujące państwa amerykańskie (1-48) i lata (1900-1917). Wszystkie zmienne zmieniają się w czasie z jednym wyjątkiem. Ten wyjątek jest niezmiennikiem w czasie i trzytopoziomową zmienną kategoryczną mierzącą regionalne oznaczenia dla stanów testowanych za pomocą dwóch zmiennych fikcyjnych. Chcę również spojrzeć na interakcje między jednym z manekinów i kilkoma zmiennymi zmieniającymi się w czasie. Oceny OLS tego modelu wskazują na heteroscedastyczność. Biorąc pod uwagę organizację danych, moje pytanie brzmi, która z technik paneli jest najlepsza i dlaczego używam Staty. Dzięki, RB zapytał Jan 3 14 o 15:41 Powiedziałbym, że to zależy od danych. Ale są pewne ogólne pomysły dotyczące specyfikacji modelu. Metoda ustalonych efektów jest spójna i dlatego powinna być używana do kontrolowania czynników zakłócających na poziomie podmiotu. Jeśli nie ma czynników zakłócających na poziomie podmiotu, metoda losowych efektów jest skuteczna w celu uwzględnienia skorelowanych błędów. OLS vs. Naprawiono efekty. F-test wspólnego znaczenia przechwyconych efektów stałych. Hipoteza zerowa jest taka, że ​​wszystkie przechwycone efekty stałe wynoszą zero. Jeśli wartość null zostanie odrzucona, musimy użyć metody efektów stałych. Test F jest automatycznie przeprowadzany po uruchomieniu xtreg w Stata. Pojawia się na dole wyjścia regresji. Naprawiono vs losowe efekty: test Hausmana. Hipoteza zerowa jest taka, że ​​współczynniki nachylenia dwóch porównywanych modeli nie różnią się istotnie. Jeśli szacunki są różne, odrzucamy efekty romdom i musimy używać efektów stałych, w przeciwnym razie stosujemy bardziej efektywną metodę efektów losowych. W Stacie jest hausman dowództwa. Odpowiedział Jan 3 14 o 16:10 Myślę, że zmarszczka jest zmienną niezmienną w czasie (3 poziomy, 2 manekiny), która jest tworzona przy użyciu agregacji danych przekrojowych (stanów). Więc jeśli uruchomię model efektów stałych w Stacie, dwa manekiny odpadną. Czy rozwiązaniem jest upuszczenie dwóch manekinów i wystarczy spojrzeć na poszczególne stany, które składają się na te dwa manekiny Jeszcze raz dziękuję, RB ndash użytkownik36830 Jan 3 14 o 16:28 Masz rację, user36830. Ogólnie mówiąc, metoda efektów stałych nie może obsłużyć zmienności czasowych, ale najnowsze artykuły mogą być dla Ciebie interesujące. Jeśli naprawdę interesują Cię efekty współzmiennych zmiennych w czasie, możesz skorzystać z metody efektów losowych. Istnieje również inny model danych z panelu wzdłużnego, nazywany modelami średniej populacji (lub marginalnymi) (na przykład modele z uogólnionymi modelami szacowania), w porównaniu do modeli specyficznych dla danego podmiotu. Zobacz moje wyjaśnienie tutaj. ndash Jiebiao Wang Jan 3 14 o 16: 49Stata: Analiza danych i oprogramowanie statystyczne Dynamiczna analiza danych panelowych (DPD) Stata dysponuje zestawem narzędzi do dynamicznej analizy danych panelowych: xtabond implementuje estymator Arellano i Bond, który wykorzystuje warunki momentów, w których opóźnienia zmiennej zależnej i pierwsze różnice zmiennych egzogenicznych są instrumentami dla pierwszego różniczkowanego równania. xtdpdsys implementuje estymator Arellano i BoverBlundell i Bond, który wykorzystuje warunki i momenty momentów xtabond, w których opóźnione pierwsze różnice zmiennej zależnej są instrumentami dla równania poziomu. xtdpd. dla zaawansowanych użytkowników, jest bardziej elastyczną alternatywą, która pasuje do modeli o średniej ruchomej korelacji niskiego rzędu w błędach idiosynkratycznych i z góry określonych zmiennych o bardziej skomplikowanej strukturze niż dozwolona w xtabond i xtdpdsys. Narzędzia do oceny wyników pozwalają na przetestowanie korelacji szeregowej w pierwszorzędnych różnicach i przetestowanie ważności ograniczeń związanych z nadmierną identyfikacją. Opierając się na pracy Layarda i Nickella (1986), Arellano i Bond (1991) dopasowują dynamiczny model popytu na pracę do niezrównoważonego zespołu firm zlokalizowanych w Wielkiej Brytanii. Najpierw modelujemy zatrudnienie pod względem płac, kapitału, produkcji przemysłowej, rocznych manekinów i trendów czasowych, w tym jednego opóźnienia w zatrudnieniu i dwóch opóźnień płac i kapitału. Użyjemy jednoetapowego estymatora ArellanondashBond i zażądamy jego niezawodnej VCE: Ponieważ uwzględniliśmy jedno opóźnienie n w naszym modelu regresji, xtabond wykorzystał opóźnienia 2 i powrót jako instrumenty. Różnice w zmiennych egzogenicznych służą również jako instrumenty. Tutaj poprawiamy nasz model, używając zamiast tego xtdpdsys, abyśmy mogli uzyskać estymaty ArellanondashBoverBlundellndashBond: Porównywanie stopek dwóch poleceń wyjściowych ilustruje kluczową różnicę między tymi dwoma estymatorami. xtdpdsys zawierał opóźnione różnice n jako instrumenty w równaniu poziomu xtabond nie. Warunki momentów tych estymatorów GMM są ważne tylko wtedy, gdy nie ma szeregowej korelacji w błędach idiosynkratycznych. Ponieważ pierwsza różnica białego szumu jest koniecznie autokorelacji, musimy jedynie zajmować się drugą i wyższą autokorelacją. Możemy użyć estat abond, aby przetestować autokorelację: Referencje Arellano, M. i S. Bond. 1991. Niektóre testy specyfikacji danych panelowych: dowód Monte Carlo i zastosowanie do równań zatrudnienia. Recenzja badań ekonometrycznych 58: 277ndash297. Layard, R. i S. J. Nickell. 1986. Bezrobocie w Wielkiej Brytanii. Economica 53: 5121ndash5169.Stata: Analiza danych i oprogramowanie statystyczne Nicholas J. Cox, Durham University, Wielka Brytania Christopher Baum, Boston College egen, ma () i jego ograniczenia Statarsquos najbardziej oczywistym dowodem do obliczania średnich kroczących jest funkcja ma () egenu . Biorąc pod uwagę wyrażenie, tworzy ono średnią ruchomą okresu tego wyrażenia. Domyślnie jest traktowany jako 3. musi być nieparzysty. Jednakże, ponieważ ręczne wprowadzenie wskazuje, np., Ma () nie może być łączone z przez listę var:. i tylko z tego powodu nie ma zastosowania do danych panelowych. W każdym razie jest poza zbiorem poleceń specjalnie napisanych dla serii czasowych, aby zobaczyć szczegóły serii czasowych. Alternatywne podejścia Aby obliczyć średnie ruchome dla danych panelu, istnieją co najmniej dwie opcje. Oba zależą od wcześniejszego zestawu danych. Jest to bardzo warte zrobienia: nie tylko możesz zaoszczędzić sobie wielokrotnie określając zmienną panelu i zmienną czasu, ale Stata zachowuje się elegancko, biorąc pod uwagę wszelkie luki w danych. 1. Napisz własną definicję za pomocą generate Używając operatorów szeregów czasowych, takich jak L. i F. podać definicję średniej ruchomej jako argument do instrukcji generującej. Jeśli to zrobisz, oczywiście nie jesteś ograniczony do równo ważonych (nieważonych) średnich kroczących obliczanych przez egen, ma (). Na przykład, ważone równomiernie trzy-okresowe średnie kroczące byłyby podane przez niektóre wagi i można je łatwo określić: Można oczywiście określić wyrażenie, takie jak log (myvar) zamiast nazwy zmiennej, takiej jak myvar. Jedną dużą zaletą tego podejścia jest to, że Stata automatycznie robi to, co właściwe dla danych panelu: wartości wiodące i opóźniające są opracowywane w ramach paneli, tak jak logika dyktuje, że powinny one być. Najbardziej godną uwagi wadą jest to, że linia poleceń może być dość długa, jeśli średnia ruchoma obejmuje kilka terminów. Innym przykładem jest jednostronna średnia ruchoma oparta tylko na poprzednich wartościach. Może to być przydatne do generowania adaptacyjnego oczekiwania na to, co zmienna będzie bazować wyłącznie na informacji do tej pory: co może ktoś prognozować na bieżący okres w oparciu o cztery ostatnie wartości, stosując stały schemat ważenia (A 4-okresowe opóźnienie może być szczególnie często używane w kwartalnych seriach czasowych.) 2. Użyj egen, filter () from SSC Użyj napisanego przez użytkownika funkcji egen filter () z pakietu egenmore na SSC. W Stata 7 (zaktualizowanym po 14 listopada 2001 r.) Można zainstalować ten pakiet, po czym pomocna jest np. Szczegóły dotyczące filtru (). Dwa powyższe przykłady byłyby renderowane (w tym porównaniu podejście generujące jest być może bardziej przejrzyste, ale za chwilę zobaczymy przykład odwrotności). Opóźnienia są numerami. wyprowadza ujemne opóźnienia: w tym przypadku -11 rozwija się do -1 0 1 lub wyprowadzenie 1, opóźnienie 0, opóźnienie 1. Współczynniki, inna liczba, pomnożenie odpowiednich elementów opóźniających lub wiodących: w tym przypadku te elementy to F1.myvar . myvar i L1.myvar. Efektem opcji znormalizowanej jest skalowanie każdego współczynnika przez sumę współczynników, aby unormowanie koef (1 1 1) było równoważne ze współczynnikami 13 13 13, a normalizacja coef (1 2 1) jest odpowiednikiem współczynników 14 12 14 Musisz określić nie tylko opóźnienia, ale także współczynniki. Ponieważ egen, ma () dostarcza równie ważonego przypadku, głównym uzasadnieniem dla egen, filter () jest wspieranie nierównomiernie ważonego przypadku, dla którego należy podać współczynniki. Można również powiedzieć, że zobowiązanie użytkowników do określania współczynników jest niewielką presją na ich myślenie o tym, jakie współczynniki chcą. Głównym uzasadnieniem dla równych wag jest, jak sądzimy, prostota, ale jednakowe wagi mają kiepskie właściwości domen częstotliwości, aby wymienić tylko jedną uwagę. Trzeci przykład powyżej może być tak samo skomplikowany jak podejście generujące. Istnieją przypadki, w których egen, filter () daje prostszą formułę niż generuje. Jeśli potrzebujesz dziewięcio terminowego filtra dwumianowego, który klimatologowie uznają za przydatny, wygląda na to, że jest mniej straszny niż i łatwiejszy do uzyskania niż tak, jak w przypadku podejścia generującego, np., Filter () działa poprawnie z danymi panelu. W rzeczywistości, jak stwierdzono powyżej, zależy to od wcześniejszego zestawienia zbioru danych. Wskazówka graficzna Po obliczeniu średnich kroczących prawdopodobnie będziesz chciał spojrzeć na wykres. Napisany przez użytkownika tsgraph polecenia jest inteligentny o zestawach danych tsset. Zainstaluj go w aktualnym Stata 7 przez ssc inst tsgraph. A co z podzbiorem, jeśli żaden z powyższych przykładów nie wykorzystuje ograniczeń. W rzeczywistości egen, ma () nie pozwoli, jeśli zostanie określone. Czasami ludzie chcą używać, jeśli podczas obliczania średnich kroczących, ale ich użycie jest nieco bardziej skomplikowane niż zwykle. Czego można się spodziewać po średniej ruchomej obliczonej za pomocą if? Zidentyfikujmy dwie możliwości: Słaba interpretacja: nie chcę widzieć żadnych wyników dla wykluczonych obserwacji. Mocna interpretacja: Nie chcę nawet, abyś używał wartości dla wykluczonych obserwacji. Oto konkretny przykład. Przypuśćmy, że w wyniku jakiegoś warunku if uwzględnione są obserwacje 1-42, ale nie obserwacje 43. Jednak średnia ruchoma dla 42 będzie zależeć, między innymi, od wartości dla obserwacji 43, jeśli średnia rozciąga się do tyłu i do przodu i ma długość co najmniej 3, i będzie podobnie zależała od niektórych obserwacji 44 i dalej w pewnych okolicznościach. Domyślamy się, że większość ludzi wybierałaby słabą interpretację, ale czy to jest poprawne, np., Filter () również nie obsługuje, jeśli. Zawsze możesz zignorować to, czego chcesz, a nawet ustawić niepotrzebne wartości, które następnie znikną, używając polecenia Zamień. Notatka o brakujących wynikach na końcach serii Ponieważ ruchome średnie są funkcjami opóźnień i leadów, egen, ma () powoduje brak w miejscach opóźnień i potencjalnych nieobecności, na początku i na końcu serii. Opcja nomiss wymusza obliczenie krótszych, niecento - rowanych średnich ruchomych dla ogonów. W przeciwieństwie do tego, ani nie generuj, ani nie egen, filter () ma, lub pozwala, coś specjalnego, aby uniknąć brakujących wyników. Jeśli brakuje jakiejkolwiek wartości potrzebnej do obliczenia, brakuje tego wyniku. Do użytkowników należy decyzja, czy i jakie operacje korekcyjne są wymagane do takich obserwacji, prawdopodobnie po zapoznaniu się z zestawem danych i rozważeniem jakiejkolwiek podstawowej wiedzy, która może zostać wykorzystana.

No comments:

Post a Comment