분석의 자동 회귀 이동 평균 모델 예측 및 예측
ARIMA p, d, q 예측 방정식 ARIMA 모형은 이론적으로 시계열을 예측하기위한 가장 일반적인 종류의 모델이며 필요에 따라 차분에 의해 고정 될 수 있습니다. 아마도 비선형 변환과 함께 사용됩니다 필요한 경우 로깅 또는 수축 등의 통계적 특성이 시계열 인 임의의 변수는 통계적 특성이 모두 일정한 경우 고정적입니다. 고정 된 시리즈는 추세가 없으며 평균 주위의 변이가 일정한 진폭을 가지며 일정한 방식으로 흔들립니다 즉, 그것의 단기간 무작위 시간 패턴은 항상 통계적 의미에서 동일하게 보입니다. 후자의 조건은 평균으로부터의 이전의 자체 편차와의 자기 상관 상관 관계가 시간에 따라 일정하거나 동등하게 시간에 따라 일정하다는 것을 의미합니다. 이 형식의 변수는 신호와 노이즈의 조합으로 평소와 같이 볼 수 있으며, 신호가 분명하다면 그 신호는 patt 일 수 있습니다 고속 또는 느린 평균 반향 또는 정현파 진동 또는 부호의 급격한 변화가있을 수 있으며 계절 성분을 가질 수도 있습니다. ARIMA 모델은 신호를 잡음에서 분리하려고하는 필터로 볼 수 있으며 신호는 고정 된 시계열에 대한 ARIMA 예측 방정식은 예측 변수가 종속 변수의 시차와 예측 오차의 시차로 구성되는 선형 즉 회귀 식 방정식입니다. 예측 된 Y 값 Y의 최근 값 중 하나 이상의 가중치 합계 또는 가중치 합계 또는 하나 이상의 최신 오류 값의 가중치 합계가 포함됩니다. 예측 변수가 Y의 지연 값으로만 구성되면 순수 자동 회귀 자기 회귀 모델이며, 이것은 회귀 모델의 특별한 경우이며 표준 회귀 소프트웨어가 적용될 수 있습니다. 예를 들어, Y에 대한 1 차 자동 회귀 AR 1 모델은 독립 변수 i Statistical에서 1 LAG Y, RegressIt에서 YLAG1 예측 자 중 일부가 오류의 래그 인 경우 ARIMA 모델은 선형 회귀 모델이 아닙니다. 마지막 기간을 지정하는 방법이 없기 때문입니다 독립 변수로서 모델이 데이터에 적합 할 때 기간별로 오류를 계산해야합니다 기술적 관점에서 지연 변수를 예측 변수로 사용하는 문제는 모델의 예측이 모델의 선형 함수가 아니라는 것입니다. 비록 과거의 데이터의 선형 함수이기는하지만 계수이기 때문에 오차가 포함 된 ARIMA 모델의 계수는 방정식 시스템을 풀기보다는 비선형 최적화 방법 인 힐 클라이밍으로 추정해야합니다. 약어 ARIMA는 Auto-Regressive Integrated 예측 평균 방정식에서 이동 평균 (stationary average)의 진폭은 자기 회귀 항 (autoregressive terms)이라고 불리며, 예측 오차의 시차는 이동 평균 항 (moving average terms)이라고 불린다. 고정 된 시리즈의 통합 버전이라고합니다. 무작위 산책 및 임의 추세 모델, 자동 회귀 모델 및 지수 평활 모델은 모두 ARIMA 모델의 특수 사례입니다. 비 계절 ARIMA 모델은 ARIMA p, d, q 모델, 여기서, p는 자동 회귀 항의 수이고, d는 확정에 필요한 비 계절적 차이의 수이고, q는 예측 방정식의 지연 예측 오류 수입니다. 예측 방정식은 다음과 같이 구성됩니다 첫째, Y가 의미하는 d 번째 차이를 나타내는 것으로하자. Y의 두 번째 차이 d 2 경우는 2 시간 이전과의 차이가 아니라는 점을 유의하라. 오히려 첫 번째 차이점은 첫 번째 차이점이다. 2 차 미분의 이산 아날로그, 즉 지역 경향보다는 직렬의 국부 가속도. y의 관점에서 일반적인 예측 방정식은 다음과 같습니다. 여기에서 이동 평균 매개 변수 s는 eq에서 부호가 음수가되도록 정의됩니다 Box and Jenkins가 소개 한 국제 협약에 의거하여 R 프로그래밍 언어를 포함한 일부 저작자와 소프트웨어는 대신에 더하기 기호를 갖도록 정의합니다. 실제 숫자가 방정식에 연결될 때 모호성은 없지만 어떤 규약 출력을 읽을 때 소프트웨어가 사용합니다. 매개 변수가 AR 1, AR 2, MA 1, MA 2 등으로 표시되는 경우가 종종 있습니다. Y에 대한 적절한 ARIMA 모델을 식별하려면 차이점 처리의 순서를 결정해야합니다. 시리즈를 스테라 타 레이즈하고 계절성의 총체적인 특징을 제거 할 것입니다. 아마도 로깅이나 수축과 같은 분산 안정화 변환과 관련되어있을 것입니다. 이 시점에서 멈추고 차이가있는 시리즈가 일정하다고 예측하면 무작위 걸음 걸이 또는 임의대로 걸기 만하면됩니다 트렌드 모델 그러나, stationarized 시리즈는 자기 상관 (autocorrelated) 오차를 여전히 가질 수 있으며, AR 항 p1 및 / 또는 MA 항 q1의 일부가 또한 필요하다는 것을 제안한다 주어진 시계열에 가장 적합한 p, d 및 q의 값을 결정하는 과정은이 페이지의 맨 위에 링크가있는 노트의 이후 섹션에서 논의되지만 일부 페이지의 미리보기 일반적으로 직면하는 비 계절 ARIMA 모델 유형의 예가 아래에 주어져 있습니다. ARIMA 1,0,0 1 차 자동 회귀 모델은 시리즈가 고정되어 있고 자동 상관되는 경우, 아마도 자체의 이전 값의 배수와 상수이 경우의 예측 방정식은이다. Y는 그 자체가 한주기만큼 뒤떨어져있다. 이것은 ARIMA 1,0,0 상수 모델이다. Y의 평균이 0이면 상수 항은 포함되지 않을 것이다. 계수 1이 양수이고 크기가 1보다 작 으면 Y가 고정되어 있으면 크기가 1보다 작아야하며 모델은 다음주기 값이 다음과 같이 평균에서 1 배가 될 것으로 예측되어야하는 평균 복귀 거동을 설명합니다. 이 기간 값 1이 음수이면 즉, 평균이 기간보다 길다면 의미가 다음 기간보다 짧을 것이라고 예측한다. 2 차 자동 회귀 모델 ARIMA 2,0,0에서, 오른쪽의 Y t-2 항 등 계수의 부호와 크기에 따라 ARIMA 2,0,0 모델은 평균 복귀가 사인파 진동 방식으로 발생하는 시스템을 설명 할 수 있습니다. 무작위 걸음 Y 시리즈가 고정되어 있지 않으면 가장 간단한 모델은 무작위 걸음 걸이 모델로, 자기 회귀 계수가 1 인 AR 1 모델, 즉 무한히 느린 평균 반향을 갖는 계열이 모델의 예측 방정식은 다음과 같이 쓸 수 있습니다. 상수 항은 평균 기간 변동, 즉 장기 드리프트 Y 로이 모델은 노 - 요격 다시 장착 될 수 첫 번째 Y 차를 종속 변수로하는 Gression 모델 비수 식적 차이와 상수 항만을 포함하기 때문에 상수가있는 ARIMA 0,1,0 모델로 분류됩니다. 무작위 walk-without-drift 모델은 ARIMA 0,1,0 모델은 상수가 없습니다. ARIMA 1,1,0 차이가있는 1 차 자동 회귀 모델 임의의 보행 모델의 오차가 자동 상관되면, 아마도 문제는 종속 변수의 한 지연을 예측 방정식 - 즉, Y의 첫 번째 차이를 1주기만큼 후퇴시킴으로써 다음과 같은 예측 방정식을 산출 할 수 있습니다. 이것은 재 배열 될 수 있습니다. 이것은 비 계절별 차이와 상수 항이있는 1 차 자동 회귀 모델입니다 - ARIMA 1,1,0 모델. ARIMA 0,1,1, 일정한 지수 평활화가없는 경우. 무작위 걸음 모델에서 자동 상관 오류를 수정하기위한 또 다른 전략은 간단한 지수 평활화 모델에 의해 제안됩니다. 비정규 시계열 예 : 천천히 변하는 평균 주위의 시끄러운 요동을 나타내는 시계열 무작위 도보 모델은 과거 값의 이동 평균뿐만 아니라 다음 관찰의 예측으로 가장 최근의 관측치를 사용하지 않고 , 노이즈를 필터링하고 지역 평균을보다 정확하게 추정하기 위해 마지막 몇 가지 관측치의 평균을 사용하는 것이 더 좋습니다. 이 지수를 달성하기 위해 지수 가중 이동 평균을 사용한 지수 평활화 모델이 과거 값의 이동 평균을 사용합니다. 간단한 지수 평활화 모델은 수학적으로 동일한 형태로 작성 될 수 있는데, 그 중 하나는 이전의 예측이 오류의 방향으로 조정되는 소위 오류 수정 형식입니다. 1 - t - 1 정의에 따르면, 이것은 ARIMA 0,1,1과 같이 다시 쓸 수 있습니다. - 1 - 1로 일정하지 않은 예측 방정식 - 이것은 당신이 간단한 지수 smo ARIMA 0,1,1 모델을 상수가 아닌 것으로 지정하여 추정 한 MA 1 계수는 SES 공식에서 1 - 마이너스 - 알파에 해당합니다. SES 모델에서 1- 기간 예측은 1 일입니다. 이는 추세 또는 전환점을 약 1 기간 지연시키는 경향이 있습니다. ARIMA의 1 기간 예측에서 평균 데이터가 0,1,1 - 상수 모델은 1 1 - 1입니다. 예를 들어, 1 0 8 일 경우 평균 연령은 5입니다. 1이 1에 가까워지면 ARIMA 0,1,1 - 비 상수 모델은 매우 장기적인 이동 평균이됩니다. 1이 0에 가까워 질수록 랜덤 워크리스 드리프트 모델이됩니다. AR 항을 추가하거나 MA 항을 추가하는 자기 상관을 보정하는 가장 좋은 방법 위에 언급 한 이전 두 모델에서 임의 워킹 모델의 자기 상관 오류의 문제 방정식에 차분 계열의 지연 값을 추가하거나 foreca의 지연 값을 추가하여 두 가지 다른 방법으로 수정되었습니다. st error 어느 접근법이 가장 좋은가이 상황에 대한 경험칙은 나중에 자세하게 논의 될 것이며, 양의 자기 상관은 일반적으로 AR 항을 모델에 추가하여 가장 잘 처리되며 음의 자기 상관은 일반적으로 MA 용어 추가 비즈니스 및 경제 시계열에서 부정적 자기 상관은 종종 차이점 생성의 인공물로 발생합니다. 일반적으로 차이 분석은 양의 자기 상관 관계를 감소 시키며 긍정에서 부정적인 자기 상관로 전환 할 수도 있습니다. 따라서 ARIMA 0,1,1 모델은 ARIMA 1,1,0 모델보다 차별화 된 MA 용어가 더 자주 사용됩니다. ARIMA 0,1,1 성장과 함께 일정하고 단순한 지수 평활화 ARIMA 모델로 SES 모델을 구현하면 실제로 유연성 우선, 추정 된 MA 1 계수는 음수가 허용된다. 이는 SES 모델에서 1보다 큰 평활화 계수에 해당하며, 일반적으로 SES 모델 피팅 절차에 의해 허용되지 않는다. ARIMA 모델에 일정한 항을 포함 시켜서 평균 0이 아닌 추세를 추정 할 수 있습니다. 상수가있는 ARIMA 0,1,1 모델은 예측 방정식을가집니다. 한주기 미리 이 모델의 예측은 장기 예측의 궤도가 일반적으로 기울기가 수평 선이 아닌 mu와 동일한 경 사진 선인 경우를 제외하고는 SES 모델의 예측과 정 성적으로 유사합니다. ARIMA 0,2,1 또는 0, 선형 선형 지수 평활화가없는 선형 선형 평활화 모델은 MA 조건과 함께 2 개의 비 계절적 차이를 사용하는 ARIMA 모델입니다. 계열 Y의 두 번째 차이는 단순히 Y와 두 기간에 의해 지연되는 자체의 차이가 아니라 오히려 첫 번째 차이의 첫 번째 차이 - 기간 t에서의 Y의 변화 변화 따라서, 기간 t에서의 두 번째 Y 차이는 다음과 같습니다. Y t - Y t - 1 - Y t - 1 - Y 이산 함수의 두 번째 차이점은 analogue이다. s를 연속 함수의 2 차 미분 값으로 변환합니다. 상수가없는 ARIMA 0,2,2 모델은 계열의 두 번째 차이가 마지막 함수의 선형 함수와 같다고 예측합니다 두 개의 예측 오차. 재 배열 될 수있다. 1과 2는 MA 1과 MA 2 계수이다. 이것은 홀트 모델과 본질적으로 동일한 일반적인 선형 지수 평활 모델이며 브라운 모델은 특별한 경우이다. 지수 적으로 가중 된 이동 평균을 사용하여 일련의 지역 수준과 지역 추세를 추정합니다. 이 모델의 장기 예측은 계열의 끝으로 관측 된 평균 추세에 따라 기울기가 정해지는 직선으로 수렴됩니다. ARIMA 1,1,2 일정한 감쇠 추세 선형 지수 평활화. 이 모델은 ARIMA 모델의 동반 슬라이드에 설명되어 있습니다. 시리즈 끝 부분에서 지역 경향을 추정 하지만 더 긴 예측 시야에서이를 평평하게하여 경험적 지원이있는 실무 Gardner와 McKenzie의 감쇠 된 추세에 대한 기사와 Armstrong 외의 Golden Rule 기사를 참조하십시오. 일반적으로 p q는 1보다 크지 않습니다. 즉, ARIMA 2,1,2와 같은 모델을 적합하게하려고하지 마십시오. 이는 overfitting 및 공통 요인 문제로 이어질 가능성이 있으므로 수학에 관한 참고 사항에서 자세히 설명합니다 ARIMA 모델의 구조. 스프레드 시트 구현 위에서 설명한 ARIMA 모델은 스프레드 시트에서 구현하기 쉽습니다. 예측 식은 원래 시간 시리즈의 과거 값과 오류의 과거 값을 참조하는 단순한 선형 방정식입니다. 따라서, A 열의 데이터, B 열의 예측 수식 및 C 열의 오류 데이터를 뺀 ARIMA 예측 스프레드 시트 열 B의 일반적인 셀의 예측 수식은 단순히 선형 표현식 셀 A와 C의 이전 행의 값을 참조하고, 자동 회귀 및 이동 평균 Nongaussian 시퀀스에 대한 예측 및 예측에서 스프레드 시트의 다른 곳에있는 셀에 저장된 적절한 AR 또는 MA 계수를 곱한 값. 최종 총 가격은 현지 부가가치세에 따라 달라질 수 있습니다. 예측 문제 및 모델 계수 추정의 경우, 특히 가우스 사례의 경우 장기간 및 이동 평균 모델을 연구했습니다. 최근 몇 년 동안에 만 해당 문제가 더 복잡하지만보다 풍부한 구조를 가질 수 있다는 것을 깨달은 비 가우시안 모델의 경우에 특별한주의가 기울여졌다. 이산 시간 자동 회귀 이동 평균 모델은 방정식 시스템의 해법 xt이다. 여기서 시퀀스 t는 E t 0, E t 2 2 0 2를 갖는 독립적으로 동일하게 분포 된 확률 변수의 시퀀스이다. 계수 ajbk는 실수이고 0 b 0 1을 설정하는 것이 일반적이다. 다항식이 절대 값 1이 0이 아니고 오직이 해가 유일하게 결정되는 경우에만 추정 문제는 주어진 계수 ajbk를 추정하는 것이다 관측열 x 1,, x n 고정 된 해 xt는 다항식 az가 절대 값이 1보다 큰 모든 제로가있는 경우 인과 관계가있다. 즉 현재와 과거의 관점에서 xt의 일방적 인 표현 이 연구는 부분적으로 해군 연구 보조금 N00014-90-J1372.8에 의해 뒷받침되었다. 3 회귀 모형. 다중 회귀 모형에서 우리는 다음과 같은 변수를 예측했다. 자동 회귀 모델에서 우리는 변수의 과거 값의 선형 조합을 사용하여 관심 변수를 예측합니다. 자동 회귀라는 용어는 변수에 대한 회귀임을 나타냅니다. 자동 회귀 모델 주문 p는 다음과 같이 쓸 수 있습니다. 여기서 c는 상수이고 et는 백색 잡음입니다. 이것은 다중 회귀와 비슷하지만 yt의 지연 값이 예측 변수로 사용됩니다. 이를 AR p 모델이라고합니다. 다양한 시계열 패턴을 처리 할 때 매우 융통성 있음 그림 8 5의 두 시리즈는 AR 1 모델과 AR 2 모델의 시리즈를 보여줍니다. phi1, dots, phip 결과를 서로 다른 시계열 패턴으로 변경합니다. 오차항 et은 패턴이 아닌 시리즈의 스케일 만 변경합니다. 그림 8 5 매개 변수가 다른 자동 회귀 모델의 데이터의 두 예 yt 18 -0 8y 등의 왼쪽 AR 1 yt가있는 오른쪽 AR 2 8 1 3y -0 7y et 두 경우 모두, 평균은 0이고 분산은 1 인 정규 분포 화이트 노이즈입니다. AR1 모델의 경우, phi1 0, yt가 백색 잡음과 같을 때입니다. phi1 1과 c0, yt가 랜덤 워크와 같으면 . phi1 1과 c ne0, yt가 drift가있는 무작위 걸음과 동등하다. phi1 0, yt가 양수와 음수 사이에서 진동하는 경향이있다. 우리는 일반적으로 자기 회귀 모델을 고정 데이터로 제한하고, 매개 변수가 필요합니다. AR 1 모델 -1 phi1 1.F 또는 AR 2 모델 -1 phi2 1, phi1 phi2 1, phi2-phi1 1. 제한 조건이 훨씬 더 복잡하면 R은 모델을 추정 할 때 이러한 제한 사항을 처리합니다.
Comments
Post a Comment