4 Análise dos dados Perfil dos participantes

Documentos relacionados
3 Método Tipo de pesquisa

Teste Anova. Prof. David Prata Novembro de 2016

5 Modelagem e análise dos resultados

Análise Estatística de Experimentos

Pressuposições à ANOVA

Renda x Vulnerabilidade Ambiental

PARTE 5 PROBABILIDADE VERSÃO: ABRIL DE 2017

Estatística Empresarial. Fundamentos de Probabilidade

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS

Análise Multivariada Aplicada à Contabilidade

CONHECIMENTOS ESPECÍFICOS

AULA 3 - Modelos probabiĺısticos, axiomas da probabilidade, espaços amostrais

ESTATÍSTICA EXPERIMENTAL. ANOVA. Aula 05

4. RESULTADOS Resultados Gerais da Amostra

Curso de Data Mining

ESTATÍSTICA RESUMO E EXERCÍCIOS DE PROVAS ANTERIORES * *Resoluções destes exercícios grátis em simplificaaulas.com

Modelos de Regressão Linear Simples parte I

O objetivo de um estudo é testar a hipótese das médias de um atributo X, a um

Modelos de Regressão Linear Simples - parte I

4 Análise dos resultados

Especialização em Engenharia de Processos e de Sistemas de Produção

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Estímulos Subliminares Perceptivos em Ambientes Virtuais: Efeitos na Atitude e na Escolha do Consumidor

MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB

DELINEAMENTO INTEIRAMENTE CASUALIZADO. Profª. Sheila Regina Oro

Unidade VII Amostragem

5 Estudo de Caso e Resultados

Testes de hipóteses. Estatística Aplicada à Agricultura Mario Andrade Lira Junior, /10/2017

Teste de hipótese de variância e Análise de Variância (ANOVA)

Coeficiente de determinação R 2 no modelo de regressão linear normal

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Métodos Estatísticos

Avaliação de Desempenho de Sistemas Discretos

UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL LISTA DE EXERCÍCIOS 4

Conceito de Estatística

Resultados possíveis do nosso estudo

Reconhecimento de Padrões

ANOVA - parte I Conceitos Básicos

Probabilidade Parte 1. Camyla Moreno

Disciplina de Modelos Lineares Professora Ariane Ferreira

Universidade Federal de Goiás Instituto de Matemática e Estatística

Sondagem Indústria da Construção em Sergipe. Nível de Utilização da Capacidade de Operação permanece alto

Boas Maneiras em Aprendizado de Máquinas

Análise de Regressão - parte I

Mineração de Dados em Biologia Molecular

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política FLS 5028 Métodos Quantitativos e

Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política

Análise da Variância. Prof. Dr. Alberto Franke (48)

MATEMÁTICA MÓDULO 4 PROBABILIDADE

Capítulo 6 Análise dos Modelos

Aumento amostral via arquétipos na avaliação do potencial hídrico de espécies de eucalipto

b) 5 6 d) 1 6 e) 7 6

Proposição de um Modelo de Regressão para a Modelagem da Velocidade do Vento em Fortaleza, CE.

LISTA 29 - PROBABILIDADE 1

ANÁLISE DA UNIDADE PROBABILIDADE EM UM LIVRO DIDÁTICO DE MATEMÁTICA 1 ANALYZE OF THE PROBABILITY UNITY IN A MATHMATICS TEXTBOOK

Pesquisador. Planejamento de Experimentos Design of Experiments - DOE NOÇÕES SOBRE EXPERIMENTOS FATORIAIS. 1 - Fixar T e variar P até > Pureza

Confiabilidade de sistemas. Uma importante aplicação de probabilidade nas engenharias é no estudo da confiabilidade de sistemas.

Distribuição de Probabilidade. Prof. Ademilson

ESTUDOS CORRELACIONAIS E ESTUDOS CAUSAL-COMPARATIVOS. Ana Henriques Carla Neves Idália Pesquita Mestrado em Educação Didáctica da Matemática

Curso de Especialização em Fisioterapia Traumato-Ortopédica / 2010 NOÇÕES DE STICA

NOÇÕES SOBRE EXPERIMENTOS FATORIAIS

3 Método Tipo de pesquisa

Os principais objetivos desta pesquisa são: verificar a freqüência e as características da mesma e estimular a atenção para a análise concentrada.

COMPUTAÇÃO ENADE 2005 PADRÃO DE RESPOSTAS - QUESTÕES DISCURSIVAS

14/03/2014. Tratamento de Incertezas TIC Aula 1. Conteúdo Espaços Amostrais e Probabilidade. Revisão de conjuntos. Modelos Probabilísticos

Unidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno

Universidade Federal do Ceará Pós-Graduação em Modelagem e Métodos Quantitativos Mestrado Acadêmico na Área Interdisciplinar

Experimentos em Parcelas Subdivididas

Planejamento de instalação de experimentos no campo

Análise dos alunos do 1ºAno da Escola Naval. O problema. Sumário. O problema. A questão. Os dados (1)

INDICADORES INDUSTRIAIS RIO GRANDE DO SUL

Inteligência Artificial

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

Variável aleatória. O resultado de um experimento aleatório é designado variável aleatória (X)

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Teste para a Média Populacional com Variância Conhecida

Prova de Estatística

Tratamento de Incertezas TIC MINTER-IFMT

Mario de Andrade Lira Junior

Estatística (MAD231) Turma: IGA. Período: 2018/2

12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Unidade III ESTATÍSTICA. Prof. Fernando Rodrigues

PROBABILIDADE E ESTATÍSTICA. Aula 2 Professor Regina Meyer Branski

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Os usuários selecionados terão de escolher uma das seguintes opções:

NOÇÕES DE TESTE DE HIPÓTESES (II)

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

AULA 6 MODELOS PROBABILÍSTICOS

5 VNS com Filtro e Reconexão por Caminhos

Transcrição:

4 Análise dos dados 4.1. Perfil dos participantes A Tabela 1 apresenta a distribuição dos participantes do experimento por grau de escolaridade, curso, gênero e faixa etária. Os participantes foram predominantemente mulheres (60% da amostra). Em relação à faixa etária, praticamente 50% da amostra tem entre 16 e 20 anos. Enquanto participação de estudantes com mais de 26 anos representou apenas 7% da amostra, podemos observar que 44% está em faixa etária de 21 a 25 anos. Em consonância com a distribuição de faixa etária apresentada, é possível verificar que mais de 90% da amostra é composta por estudantes de Graduação. Apesar de 70% dos entrevistados serem estudantes de Administração, 15 estudantes (9%) de Design foram convidados a participar do experimento, com o objetivo de verificar se haveria maior tendência à identificação do estímulo presente nos web sites. Nenhuma diferença significativa foi detectada, já que apenas 1 estudante notou a presença da marca de água mineral. Tabela 1 Perfil dos participantes

48 4.2. Análise da variável consciência Para analisar a variável consciência, duas medidas foram utilizadas: a medida de recordação e a medida de reconhecimento. Todos os respondentes que reportaram ter visto a marca de água mineral Minalba em algum dos web sites visitados (pergunta 9) foram codificados como consciente. Todos que responderam sim para a pergunta 14 e não para as demais perguntas relacionadas ao reconhecimento das marcas (perguntas 10, 11, 12, 13, 14 e 15) também foram codificados como conscientes. Dos 46 participantes que foram submetidos à versão com 20 exposições da água Minalba, 9 (19,57%) perceberam sua presença nos web sites visitados (Tabela 2). Dos 40 que foram expostos à versão com 12 exposições, apenas 3 (7,5%) notaram a presença da água Minalba. No entanto, nenhum dos 38 participantes expostos à versão com 8 exposições reportou ter visto a garrafinha da água mineral. Tabela 2 Número de Exposições e Consciência Dos 12 respondentes que perceberam a presença da imagem da água mineral Minalba nos web sites, 10 (83,33%) foram identificados como conscientes através da medida de recordação (Tabela 3). Apenas 2 (16,67%) dos participantes não recordaram terem visto a marca, mas a reconheceram quando perguntados diretamente se a tinham visto em algumas das fotos apresentadas.

49 Tabela 3 Número de Exposições e Tipos de Consciência Nas sessões a seguir, o foco de análise será dado aos participantes "não conscientes", já que temos apenas 12 no grupo de "conscientes" para uma análise significativa. Portanto, serão 153 os respondentes que serão utilizados para as análises seguintes. 4.3. Teste das hipóteses 4.3.1. Teste da hipótese H1 H1: Observadores que foram submetidos a estímulos subliminares perceptivos na Internet têm atitude mais favorável em relação à marca exposta do que observadores que não foram submetidos a qualquer estímulo. Foi solicitado aos participantes que indicassem sua atitude em relação a cada marca de água mineral em uma escala de 1 a 5, sendo 1 não gosto e 5 gosto muito. As médias da atitude em relação à água mineral Minalba apresentaram-se muito próximas nos diferentes níveis de exposição, aparentando não terem diferença significativa (3,85, 3,97, 4,00 e 3,89 nas versões de zero, 8, 12 e 20 exposições, respectivamente). Um teste de análise de variância (ANOVA) mostrou que o número de exposições não exerce influência significativa na atitude em relação à água mineral Minalba (o p-valor de 0,904 e os p-valores maiores do que 0,05 para todas as comparações no teste de Tukey nos indicam que as duas variáveis analisadas são independentes). Assim, a hipótese H1 não pode ser aceita.

50 Tabela 4 ANOVA Atitude por Frequência de Exposição 4.3.2. Teste da hipótese H2 H2: O aumento do número de repetições de estímulos subliminares perceptivos na Internet resulta no aumento da atitude em relação à marca exposta até um nível máximo, depois do qual tende a diminuir. O grupo de controle (zero exposições) apresentou atitude em relação à marca de água Minalba (média = 3,85) menor que o grupo que foi exposto à versão de 8 exposições (média = 3,97). O grupo exposto a 12 repetições apresentou atitude ainda maior (média = 4,00). Na versão de 20 exposições, entretanto, a atitude diminuiu (média = 3,89) (Figura 12).

51 Figura 12 Média de Atitude por Frequência de Exposição Média de Atitude (Minalba) 5 4 3 2 1 0 3,8537 3,9737 4,0000 0 8 12 20 Frequência de Exposição 3,8919 Um teste de significância (Chi-Quadrado) foi conduzido para testar a associação entre as duas variáveis (número de exposições e atitude). O teste (pvalor = 0,286 Tabela 5) chegou à mesma conclusão da análise de variância realizada anteriormente (ANOVA), de que o número de exposições não exerce influência significativa na atitude em relação à água mineral Minalba. Assim, a hipótese H2 não pode ser aceita. Tabela 5 Chi-Quadrado - Atitude por Frequência de Exposição

52 4.3.3. Teste da hipótese H3 H3: Observadores que foram submetidos a estímulos subliminares perceptivos na Internet têm propensão de escolha maior da marca exposta do que observadores que não foram submetidos a qualquer estímulo. Para testar a hipótese H3, foi conduzido modelo de árvore de decisão, com o objetivo de verificar se alguma das variáveis coletadas seria capaz de distinguir entre a escolha da água mineral de marca Minalba e as outras. Quem escolheu Minalba foi identificado como 1 e quem escolheu outra marca foi identificado como 0. O número de exposições, o grau de escolaridade, o curso, o gênero, a faixa etária e a atitude dos respondentes foram identificadas como possíveis variáveis explicativas. Para os dados de frequência das duas classes de escolha (Tabela 6), a ausência de modelo (ou o modelo ingênuo) seria dizer que todos pertencem à classe mais comum ( 0 ), já que 88 dos 153 respondentes (57,5%) escolheram outra marca de água. Assumindo esta afirmativa como premissa verdadeira, o modelo acertaria com 57,5% de precisão. Para um modelo de classificação ter significância prática, a precisão da classificação alcançada deve ser 25% maior do que a precisão do modelo ingênuo (HAIR et al., 2010). Assim, o modelo de árvore de decisão deveria atingir precisão maior do que 71,88%. Tabela 6 Frequência das Classes de Escolha

53 O algoritmo CHAID (SAS Enterprise Miner) foi utilizado para a criação de uma árvore binária com, no máximo, dois ramos por divisão. A Tabela 7 mostra a Matriz de Confusão (desempenho do modelo) encontrada, traduzida graficamente na Figura 13. Tabela 7 Matriz de Confusão Figura 13 Plot de Classificação A taxa de classificação errada deste modelo é de 27,45% e a taxa de acerto geral é de 72,55%. Como para o modelo apresentar significância prática deveria atingir precisão maior do que 71,88%, pode-se assumir que o modelo gerado é relevante e pode ser utilizado nas análises, por ser capaz de separar as duas classes de forma satisfatória. As Figuras 14 e 15 apresentam os gráficos Lift e ROC (Receiver Operating Characteristic), respectivamente. O gráfico de Lift tem o objetivo de medir a eficácia do modelo gerado, calculando a razão entre os resultados obtidos com e sem o modelo preditivo (VUK e CURK, 2006). O modelo apresenta um Lift de quase 2 no primeiro decil, significando que, no modelo preditivo, teremos quase o dobro de respostas positivas do que se não fosse utilizado nenhum modelo.

54 A área abaixo da curva ROC é utilizada para verificar a qualidade da classificação probabilística. Um classificador aleatório como, por exemplo, a classificação de lançamentos de moedas (cara ou coroa), tem uma área de 0,5 abaixo da curva ROC, enquanto que um classificador perfeito apresenta uma área igual a 1 (VUK e CURK, 2006). Como pode ser verificada no gráfico, a área é consideravelmente maior do que 0,5, podendo-se assumir que a classificação realizada é relevante. Figura 14 Lift Chart Figura 15 ROC Chart

55 O diagrama da árvore apresenta as variáveis relevantes e as regras utilizadas na classificação dos dois grupos (escolha de Minalba e escolha de outras marcas). As folhas das árvores fazem a representação da variável escolha (Quadro 2). Quadro 2 Representação da Folha da Árvore Figura 16 Diagrama da Árvore Analisando o diagrama da árvore (Figura 16), nota-se que o primeiro split ocorre com a variável atitude. Quando o valor desta variável é de 1, 2, 3 ou 4, 26 (26,8%) dos respondentes escolhem a marca de água Minalba, folha bastante significativa, com 97 registros presentes. No entanto, quando o valor da atitude é de 5, a porcentagem dos que escolhem a Minalba sobe para 69,9% (39 dos 56 respondentes desta folha), significativamente maior do que os 42,5% (65 dos 153 respondentes) registrados na raiz da árvore.

56 Verifica-se que a variável número de exposições aparece como relevante para as pessoas com atitude muito favorável à marca Minalba (5). Nas folhas deste nível da árvore, percebe-se que as pessoas que não foram expostas a nenhum estímulo subliminar tiveram mais chance de escolher outra marca de água (53,3%) do que aquelas que foram expostas ao estímulo (na versão de 8, 12 ou 20 exposições). Estas tiveram 78% de chance de escolher a marca Minalba dentre as opções apresentadas. Assim, aceita-se a hipótese H3 para aqueles com atitude elevada em relação à marca. 4.3.4. Teste da hipótese H4 H4: O aumento do número de repetições de estímulos subliminares perceptivos na Internet resulta no aumento da propensão de escolha da marca exposta até um nível máximo, depois do qual tende a diminuir. Treze dos que participaram do grupo de controle (31,7%) (zero exposições), selecionaram a água Minalba, comparado com 47,4% (18) na versão de oito exposições. No grupo de 12 exposições, a seleção da marca Minalba continuou aumentando, com 51,4% (19) dos participantes tendo selecionado esta marca. Na versão de 20 exposições, pela primeira vez, o índice decresceu e foram apenas 15 (40,5%) dos respondentes que preferiram a água Minalba (Figura 17). 60,0% Figura 17 Escolha por Número de Exposições Porcentagem de Escolha de Minalba 51,4% 50,0% 47,4% 40,5% 40,0% 30,0% 31,7% 20,0% 10,0% 0,0% 0 5 10 15 20 25 Número de Exposições

57 Conduziu-se um teste de significância (Chi-Quadrado) entre a escolha, variável dependente codificada como "1 = escolha da Minalba" ou "0 = não escolha da Minalba (São Lourenço ou Petrópolis)" e o número de exposições da marca de água mineral Minalba. O resultado (p-valor = 0,530) sugere que não existe associação direta entre as duas variáveis, levando a concluir que o número de exposições não exerce influência significativa na escolha da marca de água, assim não permitindo aceitar a hipótese H4 (Tabela 8). Tabela 8 Chi-Quadrado - Escolha por Frequência de Exposição