Wednesday 6 December 2017

R moving average forecast no Brasil


Moving Average Forecasting Introdução. Como você pode imaginar, estamos olhando para algumas das abordagens mais primitivas para a previsão. Mas espero que estas sejam pelo menos uma introdução que vale a pena para algumas das questões de computação relacionadas com a implementação de previsões em planilhas. Neste sentido, vamos continuar a partir do início e começar a trabalhar com previsões de média móvel. Previsões médias móveis. Todo mundo está familiarizado com as previsões de média móvel, independentemente de eles acreditam que são. Todos os estudantes universitários fazê-los o tempo todo. Pense nos seus resultados de teste em um curso onde você vai ter quatro testes durante o semestre. Vamos supor que você tem um 85 em seu primeiro teste. O que você poderia prever para sua pontuação do segundo teste O que você acha que seu professor iria prever para a sua próxima pontuação de teste O que você acha que seus amigos podem prever para a sua próxima pontuação de teste O que você acha que seus pais podem prever para a sua próxima pontuação de teste Todo o blabbing você pôde fazer a seus amigos e pais, eles e seu professor são muito prováveis ​​esperar que você comece algo na área dos 85 que você começou apenas. Bem, agora vamos supor que, apesar de sua auto-promoção para seus amigos, você superestimar-se e figura que você pode estudar menos para o segundo teste e assim você começa um 73. Agora o que são todos os interessados ​​e despreocupado vai Antecipar você vai chegar em seu terceiro teste Existem duas abordagens muito provável para eles desenvolver uma estimativa, independentemente de se eles vão compartilhar com você. Eles podem dizer a si mesmos: "Esse cara está sempre soprando fumaça sobre sua inteligência. Hes que vai obter outro 73 se hes afortunado. Talvez os pais tentem ser mais solidários e dizer: "Bem, até agora você conseguiu um 85 e um 73, então talvez você deva imaginar sobre como obter um (85 73) 2 79. Eu não sei, talvez se você fez menos festas E werent abanando a doninhas em todo o lugar e se você começou a fazer muito mais estudando você poderia obter uma pontuação mais alta. Ambos estas estimativas são, na verdade, a média móvel previsões. O primeiro é usar apenas sua pontuação mais recente para prever o seu desempenho futuro. Isso é chamado de média móvel usando um período de dados. O segundo é também uma previsão média móvel, mas usando dois períodos de dados. Vamos supor que todas essas pessoas rebentando em sua grande mente têm tipo de puto você fora e você decidir fazer bem no terceiro teste para suas próprias razões e colocar uma pontuação mais alta na frente de seus quotalliesquot. Você toma o teste e sua pontuação é realmente um 89 Todos, incluindo você mesmo, está impressionado. Então agora você tem o teste final do semestre chegando e, como de costume, você sente a necessidade de incitar todos a fazer suas previsões sobre como você vai fazer no último teste. Bem, espero que você veja o padrão. Agora, espero que você possa ver o padrão. Qual você acha que é o apito mais preciso enquanto trabalhamos. Agora vamos voltar para a nossa nova empresa de limpeza iniciada por sua meia irmã distante chamado Whistle While We Work. Você tem alguns dados de vendas anteriores representados pela seção a seguir de uma planilha. Primeiro, apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C7 a C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve notar que nós realmente não precisamos fazer as previsões para os períodos passados, a fim de desenvolver a nossa previsão mais recente. Isso é definitivamente diferente do modelo de suavização exponencial. Ive incluído o quotpast previsões, porque vamos usá-los na próxima página da web para medir a validade de previsão. Agora eu quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C6 a C11. Observe como agora apenas as duas mais recentes peças de dados históricos são usados ​​para cada previsão. Mais uma vez eu incluí as previsões quotpast para fins ilustrativos e para uso posterior na validação de previsão. Algumas outras coisas que são de importância notar. Para uma previsão média móvel de m-período, apenas os m valores de dados mais recentes são usados ​​para fazer a previsão. Nada mais é necessário. Para uma previsão média móvel do período m, ao fazer previsões quotpast, observe que a primeira predição ocorre no período m 1. Ambas as questões serão muito significativas quando desenvolvemos nosso código. Desenvolvendo a função de média móvel. Agora precisamos desenvolver o código para a previsão da média móvel que pode ser usado de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que você deseja usar na previsão ea matriz de valores históricos. Você pode armazená-lo em qualquer pasta de trabalho que você deseja. Função MovingAverage (Histórico, NumberOfPeriods) Como Único Declarar e inicializar variáveis ​​Dim Item Como Variante Dim Counter Como Inteiro Dim Acumulação como Único Dim HistoricalSize As Inteiro Inicializando variáveis ​​Counter 1 Acumulação 0 Determinando o tamanho da Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumulando o número apropriado dos valores mais recentes anteriormente observados Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulação NumberOfPeriods O código será explicado na classe. Você quer posicionar a função na planilha para que o resultado da computação apareça onde ele deve gostar do seguinte. R - Previsão de Abordagens para Previsão editar ARIMA (AutoRegresive Integrated Moving Average) ETS (Modelo de espaço de estados de suavização exponencial) Vamos discutir como Esses métodos funcionam e como usá-los. Vista geral do pacote de previsões edit Exponential Smoothing editar Nomes AKA: média móvel ponderada exponencialmente (EWMA) Equivalente a ARIMA (0,1,1) modelo sem termo constante Usado para dados suavizados para apresentação fazer previsões simples média móvel: as observações passadas também estão ponderadas exponencialmente Suavização: atribui pesos exponencialmente decrescentes ao longo do tempo Fórmula xt - sequência de dados brutos st - saída do algoritmo de suavização exponencial (estimativa do próximo valor de x) - fator de suavização. 0160lt160160lt1601.Choosing direito nenhum modo formal de escolher a técnica estatística pode ser usado para otimizar o valor de (por exemplo, OLS) quanto maior for o próximo obtém a previsão ingênua (as mesmas portas que a série original com um período lag) Double Exponential Smoothing A suavização exponencial não funciona bem quando há uma tendência (haverá sempre um viés) A dupla suavização exponencial é um grupo de métodos que lidam com o problema Holt-Winters dupla suavização exponencial Editar E para t gt 1 por onde é o fator de suavização de dados. 0160lt160160lt1601, e é o fator de suavização de tendência. 0160lt160160lt1601. Saída F tm - uma estimativa do valor de x no tempo tm, mgt0 com base nos dados brutos até o tempo t A edição de suavização exponencial tripla leva em consideração as mudanças sazonais, bem como as tendências sugeridas pela primeira vez por Holts estudante, Xt - sequência de dados brutos das observações t 1601600 L comprimento um ciclo de mudança sazonal O método calcula: uma linha de tendência para os índices sazonais de dados que pesam os valores na linha de tendência com base no ponto em que esse ponto de tempo cai no ciclo de comprimento L. S t representa o valor suavizado da parte constante para o tempo t. Bt representa a seqüência das melhores estimativas da tendência linear que se sobrepõem às mudanças sazonais ct é a seqüência dos fatores de correção sazonal ct é a proporção esperada da tendência prevista a qualquer momento t mod L no ciclo que as observações assumem To Inicializar os índices sazonais c tL deve haver pelo menos um ciclo completo nos dados A saída do algoritmo é novamente escrita como F tm. Uma estimativa do valor de x no tempo tm, mgt0 com base nos dados brutos até o tempo t. A suavização exponencial tripla é dada pelas fórmulas onde está o fator de suavização de dados. 0160lt160160lt1601, é o fator de suavização de tendência. 0160lt160160lt1601, e é o fator de suavização da mudança sazonal. 0160lt160160lt1601. A fórmula geral para a estimativa da tendência inicial b 0 é: Definir as estimativas iniciais para os índices sazonais c i para i 1,2. L é um pouco mais envolvido. Se N é o número de ciclos completos presentes nos seus dados, então: Note que A j é o valor médio de x no jésimo ciclo de seus dados. ETS editar Alteração de parâmetros edit 8.4 Movendo modelos médios Em vez de usar valores passados ​​da variável de previsão em uma regressão, um modelo de média móvel usa erros de previsão passados ​​em um modelo de regressão. Y e teta teta e dots theta e, onde et é ruído branco. Referimo-nos a isto como um modelo de MA (q). Evidentemente, não observamos os valores de et, então não é realmente regressão no sentido usual. Observe que cada valor de yt pode ser considerado como uma média móvel ponderada dos últimos erros de previsão. No entanto, os modelos de média móvel não devem ser confundidos com o alisamento médio móvel discutido no Capítulo 6. Um modelo de média móvel é usado para prever valores futuros, enquanto o alisamento médio móvel é usado para estimar o ciclo tendencial de valores passados. Figura 8.6: Dois exemplos de dados de modelos de média móvel com diferentes parâmetros. Esquerda: MA (1) com y t 20e t 0,8e t-1. Direita: MA (2) com y t e t - e t-1 0,8e t-2. Em ambos os casos, e t é normalmente distribuído ruído branco com média zero e variância um. A Figura 8.6 mostra alguns dados de um modelo MA (1) e um modelo MA (2). Alterando os parâmetros theta1, dots, thetaq resulta em diferentes padrões de séries temporais. Tal como acontece com modelos autorregressivos, a variância do termo de erro e só irá alterar a escala da série, e não os padrões. É possível escrever qualquer modelo estacionário AR (p) como um modelo MA (infty). Por exemplo, usando a substituição repetida, podemos demonstrar isso para um modelo AR (1): begin yt amp phi1y et amp phi1 (phi1y e) amp phi12y phi1 e amp phi13y phi12e phi1 e et amptext end Provided -1 lt phi1 lt 1, o valor de phi1k será menor à medida que k for maior. Assim, eventualmente, obtemos yt et phi1 e phi12 e phi13 e cdots, um processo MA (infty). O resultado inverso é válido se impomos algumas restrições nos parâmetros MA. Em seguida, o modelo MA é chamado invertible. Ou seja, que podemos escrever qualquer processo de MA (q) invertível como um processo AR (infty). Os modelos Invertible não nos permitem simplesmente converter modelos MA para modelos AR. Eles também têm algumas propriedades matemáticas que torná-los mais fáceis de usar na prática. As restrições de invertibilidade são semelhantes às restrições de estacionaridade. Para um modelo MA (1): -1lttheta1lt1. Para um modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Condições mais complicadas mantêm-se para qge3. Mais uma vez, R irá cuidar dessas restrições ao estimar os modelos. Previsão Básica Previsão refere-se ao processo de utilização de procedimentos estatísticos para prever os valores futuros de uma série temporal baseada em tendências históricas. Para as empresas, ser capaz de avaliar os resultados esperados para um determinado período de tempo é essencial para o gerenciamento de marketing, planejamento e finanças. Por exemplo, uma agência de publicidade pode querer utilizar previsões de vendas para identificar quais meses futuros podem exigir aumento das despesas de marketing. As empresas também podem usar previsões para identificar quais vendedores atingiram suas metas esperadas para um trimestre fiscal. Há uma série de técnicas que podem ser utilizadas para gerar previsões quantitativas. Alguns métodos são bastante simples, enquanto outros são mais robustos e incorporar fatores exógenos. Independentemente do que é utilizado, o primeiro passo deve sempre ser visualizar os dados usando um gráfico de linha. Você quer considerar como a métrica muda ao longo do tempo, se há uma tendência distinta, ou se existem padrões distintos que são dignos de nota. Existem vários conceitos-chave dos quais devemos estar cientes quando descrevemos dados de séries temporais. Essas características irão informar como podemos pré-processar os dados e selecionar a técnica de modelagem adequada e parâmetros. Em última análise, o objetivo é simplificar os padrões nos dados históricos, removendo as fontes conhecidas de variatiion e tornando os padrões mais consistentes em todo o conjunto de dados. Padrões mais simples geralmente levarão a previsões mais precisas. Tendência: existe uma tendência quando há um aumento ou diminuição de longo prazo nos dados. Sazonalidade: Um padrão sazonal ocorre quando uma série temporal é afetada por fatores sazonais, como a época do ano ou o dia da semana. Autocorrelação: Refere-se aos fenômenos pelos quais os valores de Y no tempo t são impactados por valores anteriores de Y em t-i. Para encontrar a estrutura adequada de lag ea natureza dos valores auto correlacionados em seus dados, use a plotagem da função de autocorrelação. Estacionária: uma série de tempo é dita ser estacionária se não houver uma tendência sistemática, nenhuma mudança sistemática na variação, e se as variações estritamente periódicas ou seasonality não existem Técnicas de previsão quantitativas são baseadas geralmente na análise do reression ou em técnicas da série do tempo. Abordagens de regressão examinam a relação entre a variável prevista e outras variáveis ​​explicativas usando dados transversais. Modelos de séries temporais usam dados históricos que foram coletados em intervalos regulares ao longo do tempo para que a variável alvo preveja seus valores futuros. Não há tempo para cobrir a teoria por trás de cada uma dessas abordagens neste post, por isso escolhi abranger conceitos de alto nível e fornecer código para realizar previsões de séries temporais em R. Sugiro fortemente entender a teoria estatística por trás de uma técnica antes de executar o código. Primeiro, podemos usar a função ma no pacote de previsão para realizar a previsão usando o método da média móvel. Esta técnica estima valores futuros no tempo t pela média dos valores das séries temporais dentro de k períodos de t. Quando a série de tempo é estacionária, a média móvel pode ser muito eficaz como as observações são próximas através do tempo. O smooting exponencial simples também é bom quando os dados não têm tendência ou padrões sazonais. Ao contrário de uma média móvel, esta técnica dá maior peso às observações mais recentes das séries temporais. No pacote de previsão, há uma função de previsão automática que será executada através de modelos possíveis e selecionar o modelo mais adequado dar os dados. Isso poderia ser um modelo auto regressivo do primeiro oder (AR (1)), um modelo ARIMA com os valores corretos para p, d, e q, ou algo mais que é mais apropriado. Lá vai você, uma introdução básica não-técnica à previsão. Isso deve familiarizar-se com os conceitos-chave e como realizar algumas previsões básicas em R Nunca perca uma atualização Subscrever os R-blogueiros para receber e-mails com as últimas postagens R. (Você não verá esta mensagem novamente.)

No comments:

Post a Comment