Criar A Categorical Variable In Stata Forex


Bem-vindo ao Instituto de Pesquisas Digitais e Educação Módulo de Aprendizagem Stata Criando e recodificando variáveis ​​Este módulo mostra como criar e recodificar variáveis. Em Stata você pode criar novas variáveis ​​com gerar e você pode modificar os valores de uma variável existente com substituição e com recodificação. Computação de novas variáveis ​​usando gerar e substituir Vamos usar os dados automaticamente para nossos exemplos. Nesta seção, veremos como calcular variáveis ​​com gerar e substituir. O comprimento variável contém o comprimento do carro em polegadas. Abaixo, veremos estatísticas resumidas para o comprimento. Permite usar o comando generate para criar uma nova variável que tenha o comprimento em pés em vez de polegadas, chamado lenft. Devemos enfatizar que gerar é criar uma nova variável. Para uma variável existente, você precisa usar o comando substituir (não gerar). Conforme mostrado abaixo, usamos substituir para repetir a atribuição para lenft. A sintaxe de gerar e substituir é idêntica, exceto: - gerar trabalhos quando a variável ainda não existe e dará um erro se a variável já existir. - substituir obras quando a variável já existe e dará um erro se a variável ainda não existir. Suponhamos que queríamos criar uma variável chamada length2 que tenha um comprimento quadrado. Ou talvez possamos fazer loglen, que é o log natural do comprimento. Permite obter o desvio padrão médio e o comprimento e podemos fazer escores Z de comprimento. A média é 187.93 e o desvio padrão é 22.27, então o zlength pode ser calculado como mostrado abaixo. Com gerar e substituir você pode usar - para adição e subtração você pode usar para multiplicação e divisão que você pode usar para expoentes (por exemplo, length2) você pode usar () para controlar a ordem das operações. Recodificação de novas variáveis ​​usando gerar e substituir Suponha que queríamos quebrar o mpg em três categorias. Vamos ver uma tabela de mpg para ver onde podemos desenhar as linhas para essas categorias. Permite converter mpg em três categorias para ajudar a tornar isso mais legível. Aqui, convertem o mpg em três categorias usando gerar e substituir. Vamos usar tabulações para verificar se isso funcionou corretamente. Na verdade, você pode ver que um valor de 1 para mpg3 vai de 12-18, um valor de 2 vai de 19-23 e um valor de 3 vai de 24-41. Agora, poderíamos usar mpg3 para mostrar uma tabela de crosstag de mpg3 por estrangeiros para contrastar a quilometragem dos carros estrangeiros e domésticos. A referência cruzada acima mostra que 21 dos carros domésticos se enquadram na categoria de alta quilometragem, enquanto 55 dos carros estrangeiros se enquadram nesta categoria. Recodificação de variáveis ​​usando recode Existe uma maneira mais fácil de recodificar mpg para três categorias usando gerar e recodificar. Primeiro, fazemos uma cópia do mpg. Chamando mpg3a. Em seguida, usamos recode para converter o mpg3a em três categorias: min-18 em 1, 19-23 em 2 e 24-max em 3. Vamos verificar duas vezes para ver se isso funcionou corretamente. Vemos que funcionou perfeitamente. Recodes com se permite criar uma variável chamada mpgfd que avalia a quilometragem dos carros em relação à sua origem. Deixe que esta seja uma variável de 01 chamada mpgfd, que é: 0 se abaixo do mpg médio para o seu grupo (domino estrangeiro) 1 se atabo o mpg médio para o seu grupo (domínico estrangeiro). Nós vemos que a mediana é de 19 para os carros domésticos (estrangeiros) e 24,5 para os carros estrangeiros (estrangeiros1). Os comandos de geração e recomeçamento abaixo recodam o mpg para o mpgfd com base na mediana do carro doméstico para os carros domésticos e com base na mediana do carro estrangeiro para os carros estrangeiros. Podemos verificar usando isso abaixo, e o valor recodificado mpgfd parece correto. Crie uma nova variável que seja comprimento dividido por 12. Mude os valores de uma variável existente chamada lenft. Recode mpg em mpg3. Ter três categorias usando gerar e substituir se. Recode mpg em mpg3a. Tendo três categorias, 1 2 3, usando gerar e recodificar. Recode mpg em mpgfd. Tendo duas categorias, mas usando diferentes pontos de corte para carros estrangeiros e domésticos. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela University of California. Stata: análise de dados e software estatístico William Gould, StataCorp Uma variável dummy é uma variável que assume Os valores 1 e 0 1 significam que algo é verdadeiro (como a idade 25, o sexo é masculino ou a categoria ldquovery muchrdquo). As variáveis ​​dummy também são chamadas de variáveis ​​de indicadores. Como veremos em breve, na maioria dos casos, se você usar a notação variável de fatores, não é necessário criar variáveis ​​falsas. Nos casos em que as variáveis ​​do fator não são a resposta, você pode usar gerar para criar uma variável dummy ao mesmo tempo e tabular para criar um conjunto de manequins ao mesmo tempo. Usando variáveis ​​de fatores ao invés de gerar variáveis ​​dummy, eu tenho uma variável discreta, tamanho. Que assume valores discretos de 0 a 4 Se eu quiser um manequim para todos os níveis de tamanho, exceto para um grupo de comparação ou nível básico, não preciso criar 4 manequins. Usando variáveis ​​do fator U. Eu posso digitar ou usar um estimador Se eu quiser usar um manequim que seja 1 se o tamanho for grande (tamanho3) e 0 caso contrário, eu tipo Se eu quiser fazer o grupo de comparação, ou nível básico, de tamanho ser tamanho3 em vez do Tamanho padrão0. Eu escrevo Você também pode usar a notação da variável fator para se referir a variáveis ​​categóricas, suas interações ou interações entre variáveis ​​categóricas e contínuas. Por exemplo, posso especificar a interação de cada nível de tamanho (exceto o nível base) e a variável contínua x digitando The c. Instrui Stata que a variável x é contínua. Em todos os casos acima, você não precisou criar uma variável. Além disso, muitas das instalações de correção de Statas, incluindo, em particular, o comando das margens, estão conscientes das variáveis ​​dos fatores e as abordarão de forma elegante ao fazer cálculos. Existem alguns casos em que a criação de manequins pode valer a pena. Nós ilustramos estes abaixo. Usando gerar para criar variáveis ​​dummy Esta declaração faz o mesmo que as duas primeiras instruções. Agelt25 é uma expressão, e Stata avalia-o retornando 1 se a declaração for verdadeira e 0 se for falso. Se você tiver valores perdidos em seus dados, seria melhor se você digitar Stata trata um valor faltante como infinito positivo, então a expressão agelt25 avalia para 0, não faltando, quando a idade está faltando. (Se a expressão fosse agegt25. A expressão avaliaria para 1 quando a idade estiver faltando.) Você não precisa digitar os parênteses ao redor da expressão. É bom o suficiente. Aqui estão mais algumas ilustrações de gerar variáveis ​​dummy: na linha acima, inscrito é em si uma variável dummy variablemdasha assumindo valores zero e um. Poderíamos ter digitado inscrito1. Mas a digitação é suficiente. Assim como Stata retorna 1 para verdadeiro e 0 para falso, Stata assume que 1 significa verdade e que 0 significa falso. O uso de tabulação para criar variáveis ​​falsas tabuladas com a opção generate () irá gerar conjuntos inteiros de variáveis ​​dummy. Diga que o grupo de variáveis ​​assume os valores 1, 2 e 3. Se você digitar, você verá uma tabela de freqüência de quantas vezes o grupo assumirá cada um desses valores. Se você digitar, você verá a tabela, e tabular irá criar nomes de variáveis ​​g1. G2. E g3 que assumem valores 1 e 0, g1 sendo 1 quando grupo1. G2 sendo 1 quando grupo2. E g3 sendo 1 quando grupo3. Assista: o que você nomeia a variável depende de você. Se tivéssemos digitado as novas variáveis ​​teriam sido chamadas res1. Res2. E res3. Também não é necessário que a variável seja tabulada para tomar valores seqüenciais ou mesmo ser inteira. Aqui está outro exemplo: você pode descobrir o que os valores são de descrever. Finalmente, tabulate pode ser usado com variáveis ​​de string:

Comments

Popular Posts