graphics
latticeExtra
- Gráficos
lme4
- Modelos
wzRfun
- Representação gráfica das bandas de confiança
htmlTable
- Tabelas
Indivíduos infectados pelo HIV em terapia anti-retroviral
- 100 indivíduos acompanhados durante um ano (12 meses)
- Para cada indivíduo foram feitas sete avaliações (mês 0, 1, 2, 4, 6, 8 e 12)
- Em cada avaliação foi mensurado a quantidade de CD4 no sangue que reflete o estado do sistema imunológico do indivíduo
- Maior contagem de CD4, melhor sistema imunológico. Contagens abaixo de 1000 células/mm\(^{3}\) sugerem que o sistema está um pouco comprometido
- 50 indívuos alocados no grupo 1 e 50 indivíduos alocados no grupo 2
- Grupo 1: Indivíduos tratados com terapia anti-retroviral durante 4 meses
- Grupo 2: Indivíduos tratados com terapia anti-retroviral durante todo o período de acompanhamento
Temos então um data.frame
com 700 linhas e 6 colunas
Id
): Fator com 100 níveisMeses
: Vetor de números inteiros com sete valores únicos. 0, 1, 2, 4, 6, 8 e 12CD4
: Vetor de números inteiros com as contagens de CD4Grupo
: Fator com 2 níveis, 1 e 2
- Existe diferença entre os
Grupos
em relação as contagens deCD4
?
- E os
Meses
? Como as contagens deCD4
se comportam com o passar dosMeses
?
Estamos lidando com contagens de
CD4
, logo, dada a palavra ‘contagens’ inicialmente se pensa numa distribuição Poisson. Contudo, ela também pode ser pensada como uma taxa, já que é dada por células/mm\(^{3}\)
Num primeiro momento iremos assumir uma distribuição Normal
Como vamos utilizar um modelo segmentado criamos uma nova variável chamada
tMeses
(t de truncada)
Escolhemos utilizar um ponto de quebra igual a 4, já que sabemos que a distinção entre os grupos ocorre no mês 4
data$tMeses <- with(data, ifelse(Meses < 4, 0, Meses - 4))
O primeiro modelo proposto pode ser escrito da seguinte maneira
\[ {\rm CD4}_{ij} = \mu + \beta_{m} {\rm Meses}_{i} + \beta_{t} {\rm tMeses}_{i} + \beta_{g} {\rm Grupo}_{j} + \beta_{tg} {\rm tMeses}_{i} \cdot {\rm Grupo}_{j} + \gamma_{j}^{0} + \epsilon_{ij} \]
onde \(i\) indexa o mês e \(j\) indexa o indivíduo
Nesse modelo temos o efeito fixo de Meses
, Grupo
, e sua interação, e como efeito aleatório temos os indivíduos (Id
)
# lm.id: modelo linear com efeito aleatório de indivíduo (intercepto aleatório)
lm.id <- lmer(CD4 ~ Meses + tMeses*Grupo + (1|Id), data)
Verificação dos pressupostos e ajuste do modelo
O ajuste do modelo se mostra satisfatório e os pressupostos são atendidos
Construção da banda de confiança
pred <- expand.grid(Meses = seq(0, 12, .2)
, Grupo = levels(data$Grupo)
, CD4 = 0)
pred$tMeses <- with(pred, ifelse(Meses <= 4, 0, Meses - 4))
X <- model.matrix(terms(lm.id), pred)
pred$CD4 <- X %*% fixef(lm.id)
var <- diag(X %*% tcrossprod(vcov(lm.id), X))
tlval <- qt(p = .025
, df = df.residual(lm.id)) * sqrt(var)
tuval <- qt(p = .975
, df = df.residual(lm.id)) * sqrt(var)
pred$lwr <- pred$CD4 + tlval
pred$upr <- pred$CD4 + tuval
Nesse modelo temos o efeito principal de tMeses
e Grupo
, além de sua interação
A presença do efeito principal de Grupo
faz com que tenhamos duas retas distintas, uma para cada Grupo
No gráfico acima observamos que a curva ajustada para os indivíduos do Grupo
2 se mostra mais elevada, i.e., indica maiores contagens de CD4
. Esse comportamento já era de certa forma esperado, já que com a dispersão dos pontos dada no fundo do gráfico podemos observar em geral maiores contagens de CD4
nos indivíduos do Grupo
2
Lembrando.
Grupo
1: Indivíduos tratados com terapia anti-retroviral durante 4 meses.Grupo
2: Indivíduos tratados com terapia anti-retroviral durante todo o período de acompanhamento
Do ponto de quebra em diante para os indivíduos do Grupo
1 observamos uma queda nas contagens de CD4
. Já nos indivíduos do Grupo
2 observamos uma estagnação
Existe a hipótese de que após um determinado tempo a parada no tratamento (Grupo
1) é benéfica, o que é refletido em maiores contagens de CD4
. Pelo gráfico vemos que essa hipótese a princípio não é confirmada
Nos Meses
em que todos os indivíduos estão sob tratamento as bandas de confiança dos grupos chegam a se sobrepor, a partir do ponto de quebra, i.e., quando o Grupo
1 para de receber o tratamento, isso já não ocorre mais
Estimativas do modelo em células/mm\(^{3}\)
Estimativa | Erro padrão | |
---|---|---|
Mês 0 - Grupo 1
|
251.1166 | 10.6206 |
Mês 0 - Grupo 2
|
270.1609 | 10.6206 |
Inclinação - Mês ≤ 4 | 37.923 | 1.8412 |
Inclinação - Grupo 1
|
-9.1967 | 1.3266 |
Inclinação - Grupo 2
|
1.3669 | 1.3266 |
σId | 63.7719 |
|
σ | 62.8239 |
|
Considerar um efeito aleatório dos indivíduos significa inserir um diferente intercepto para cada indivíduo. As inclinações das retas são as mesmas, o que muda é apenas o intercepto
O desvio padrão para o intercepto é de 63.77 células/mm\(^{3}\)
Existe certa variação adicional nas contagens de CD4
com desvio padrão de 62.82. Sua alta estimativa pode indica uma considerável variação mês a mês nas contagens de CD4
dos indivíduos
\[ {\rm CD4}_{ij} = \mu + \beta_{m} {\rm Meses}_{i} + \beta_{tg} {\rm tMeses}_{i} \cdot {\rm Grupo}_{j} + \gamma_{j}^{0} + \epsilon_{ij} \]
onde \(i\) indexa o mês e \(j\) indexa o indivíduo
Nesse modelo temos o efeito fixo de Meses
, sua interação com Grupo
, e como efeito aleatório temos os indivíduos (Id
)
# lm2.id: modelo linear com efeito aleatório de indivíduo (intercepto aleatório)
lm2.id <- lmer(CD4 ~ Meses + tMeses:Grupo + (1|Id), data)
Verificação dos pressupostos e ajuste do modelo
O ajuste do modelo se mostra satisfatório e os pressupostos são atendidos
Diferente do modelo 1, aqui não temos o efeito principal de tMeses
e Grupo
, apenas o efeito de sua interação
A ausência do efeito principal de Grupo
faz com que tenhamos uma única reta até o ponto de quebra, o que de certa forma faz sentido, já que até o mês 4 todos estão sendo tratados
As bandas de confiança não se tocam do mês 6 (aproximadamente) em diante, o que indica uma diferença significativa entre as contagens de CD4
dos dois grupos
Lembrando novamente.
Grupo
1: Indivíduos tratados com terapia anti-retroviral durante 4 meses.Grupo
2: Indivíduos tratados com terapia anti-retroviral durante todo o período de acompanhamento
Estimativas do modelo em células/mm\(^{3}\)
Estimativa | Erro padrão | |
---|---|---|
Mês 0 | 260.6388 | 8.0029 |
Inclinação - Mês ≤ 4 | 37.923 | 1.8412 |
Inclinação - Grupo 1
|
-9.4679 | 1.3114 |
Inclinação - Grupo 2
|
1.6381 | 1.3114 |
σId | 64.0638 |
|
σ | 62.8263 |
|
Comparando as estimativas de contagens de CD4
dos dois modelos
Modelo 1 | Modelo 2 | ||||||
---|---|---|---|---|---|---|---|
Mínimo | Estimativa | Máximo | Mínimo | Estimativa | Máximo | ||
Mês 0 - Grupo 1
|
230.346 | 251.1166 | 271.8873 | 244.9419 | 260.6388 | 276.3356 | |
Mês 0 - Grupo 2
|
221.9455 | 270.1609 | 318.3763 | 244.9419 | 260.6388 | 276.3356 | |
Inclinação - Mês ≤ 4 | 34.3176 | 37.923 | 41.5284 | 34.3173 | 37.923 | 41.5287 | |
Inclinação - Grupo 1
|
-18.1033 | -9.1967 | -0.2901 | -18.3642 | -9.4679 | -0.5777 | |
Inclinação - Grupo 2
|
-10.8276 | 1.3669 | 13.5614 | -7.2521 | 1.6381 | 10.5344 | |
σId | 54.0232 | 63.7719 | 74.2194 | 54.5817 | 64.0638 | 74.9518 | |
σ | 59.2815 | 62.8239 | 66.3866 | 59.2862 | 62.8263 | 66.3931 |
As estimativas dos parâmetros não é um critério válido para decidir com qual modelo ficamos, mas de qualquer forma é interessante compará-las
Nas análises gráficas de resíduos verificamos que ambos os modelos ajustaram satisfatóriamente
Medidas de comparação dos modelos
Modelo 1 | Modelo 2 | |||||||
---|---|---|---|---|---|---|---|---|
AIC | BIC | logLik | REML | AIC | BIC | logLik | REML | |
7982.3992 | 8014.2568 | -3984.1996 | 7968.3992 | 7989.3603 | 8016.6668 | -3988.6801 | 7977.3603 |
O AIC, BIC e REML são critérios do tipo menor é melhor, já a log verossimilhança é do tipo maior é melhor
Todos os critérios nos levam a escolher o modelo 1, i.e., o modelo com os efeitos principais de
tMeses
eGrupo
, ou seja, considerando uma curva para os indivíduos de cadaGrupo
anova(lm.id, lm2.id)
Data: data
Models:
lm2.id: CD4 ~ Meses + tMeses:Grupo + (1 | Id)
lm.id: CD4 ~ Meses + tMeses * Grupo + (1 | Id)
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm2.id 6 8002.4 8029.7 -3995.2 7990.4
lm.id 7 8002.5 8034.4 -3994.3 7988.5 1.8661 1 0.1719
Fazendo um teste de razão de verossimilhança também ficamos com o modelo 1, como já era de se esperar dada a tabela anterior
\[ \begin{align} {\rm CD4}_{ij} & = \mu + \beta_{m} {\rm Meses}_{i} + \beta_{t} {\rm tMeses}_{i} + \beta_{g} {\rm Grupo}_{j} + \beta_{tg} {\rm tMeses}_{i} \cdot {\rm Grupo}_{j} \\ & + \gamma_{j}^{0} + \gamma_{j}^{1} {\rm Meses}_{i} + \epsilon_{ij} \end{align} \]
onde \(i\) indexa o mês e \(j\) indexa o indivíduo
O que diferencia esse modelo do modelo 1 é o acréscimo de mais um termo de efeito aleatório
# lm.idm: modelo linear com efeito aleatório de indivíduo (intercepto aleatório)
# e de indivíduo dentro de meses (inclinação aleatória até o ponto de quebra)
lm.idm <- lmer(CD4 ~ Meses + tMeses*Grupo + (Meses|Id), data)
Verificação dos pressupostos e ajuste do modelo
O ajuste do modelo se mostra satisfatório e os pressupostos são atendidos
Estimativas de efeito fixo do modelo
Estimativa | Erro padrão | |
---|---|---|
Mês 0 - Grupo 1
|
250.9049 | 10.8059 |
Mês 0 - Grupo 2
|
270.3726 | 10.8059 |
Inclinação - Mês ≤ 4 | 37.923 | 1.8409 |
Inclinação - Grupo 1
|
-9.1949 | 1.3279 |
Inclinação - Grupo 2
|
1.3651 | 1.3279 |
Considerar um efeito aleatório dos indivíduos e dos indivíduos dentro dos meses significa inserir um diferente intercepto e inclinação até o ponto de quebra para cada indivíduo
VarCorr(lm.idm)
Groups Name Std.Dev. Corr
Id (Intercept) 65.76355
Meses 0.42164 -1.000
Residual 62.79822
O desvio padrão para o intercepto é de 65.76 células/mm\(^{3}\)
O desvio padrão para a inclinação é de 0.42
Existe certa variação adicional nas contagens de CD4
com desvio padrão de 62.8
Atente para o valor da correlação estimada entre o intercepto e a inclinação aleatória. A estimativa é de -1!
Essa correlação perfeia pode ser observada no gráfico acima
Isso mostra que o intercepto e a inclinação são altamente correlacionados e que essa correlação é negativa, i.e., para baixos valores de um deles temos altos valores do outro
Observe no gráfico abaixo que as inclinações diferem pouco de um indivíduo para outro e que a baixa estimativa do desvio padrão, 0.42, indica que pouca variabilidade dos dados é captada por este componente
Com base em todos os gráficos até aqui apresentados podemos afirmar que para baixos valores de intercepto temos altos valores de inclinações
Dada essa altíssima correlação e a baixa estimativa, há indícios de que o efeito aleatório na inclinação é desnecessário
anova(lm.id, lm.idm)
Data: data
Models:
lm.id: CD4 ~ Meses + tMeses * Grupo + (1 | Id)
lm.idm: CD4 ~ Meses + tMeses * Grupo + (Meses | Id)
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm.id 7 8002.5 8034.4 -3994.3 7988.5
lm.idm 9 8006.1 8047.1 -3994.0 7988.1 0.4289 2 0.807
Com um teste de razão de verossimilhança comparamos o modelo 3 com o modelo 1, eles diferem pela inserção de uma inclinação aleatória até o ponto de quebra
Observe que ficamos com o modelo 1, i.e., sem a inclinação aleatória até o ponto de quebra
Por default, a função
lmer
assume que todos os coeficientes associados com o mesmo termo de efeito aleatório são correlacionados
Podemos escrever o modelo 3 considerando que o intercepto e a inclinação aleatórios são não correlacionados
# lm2.idm: modelo linear com efeito aleatório de indivíduo (intercepto aleatório)
# e de indivíduo dentro de meses (inclinação aleatória até o ponto de quebra)
# não correlacionados
lm2.idm <- lmer(CD4 ~ Meses + tMeses*Grupo + (Meses||Id), data)
Verificação dos pressupostos e ajuste do modelo
O ajuste do modelo se mostra satisfatório e os pressupostos são atendidos
Estimativas do modelo em células/mm\(^{3}\)
Estimativa | Erro padrão | |
---|---|---|
Mês 0 - Grupo 1
|
251.1166 | 10.6206 |
Mês 0 - Grupo 2
|
270.1609 | 10.6206 |
Inclinação - Mês ≤ 4 | 37.923 | 1.8412 |
Inclinação - Grupo 1
|
-9.1967 | 1.3266 |
Inclinação - Grupo 2
|
1.3669 | 1.3266 |
σId-0 | 63.7719 |
|
σId-1 | 0 |
|
σ | 62.8239 |
|
Os valores das estimativas são idênticas as obtidas com o modelo 1
A única diferença é o desvio padrão da inclinação até o ponto de quebra, sua estimativa pontual é de zero
Essa estimativa nula nos diz que a presença deste coeficiente é desnecessária, já que a princípio ele não agrega na explicação da variabilidade e que as variações na inclinação inicial dos indivíduos é sempre a mesma, 0, ou seja, para todos os indivíduos a inclinação até o ponto de quebra é a mesma, 37.92
Esse último gráfico é idêntico ao obtido com o modelo 1, que difere apenas na ausência da inclinação aleatória até o ponto de quebra
anova(lm2.idm, lm.id)
Data: data
Models:
lm.id: CD4 ~ Meses + tMeses * Grupo + (1 | Id)
lm2.idm: CD4 ~ Meses + tMeses * Grupo + ((1 | Id) + (0 + Meses | Id))
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm.id 7 8002.5 8034.4 -3994.3 7988.5
lm2.idm 8 8004.5 8040.9 -3994.3 7988.5 0 1 1
Com um teste de razão de verossimilhança comparamos o modelo 4 com o modelo 1
Observe que ficamos com o modelo 1, i.e., sem a inclinação aleatória até o ponto de quebra
Comparando as estimativas de contagens de CD4
dos dois modelos
Modelo 3 | Modelo 4 | ||||
---|---|---|---|---|---|
Estimativa | Erro padrão | Estimativa | Erro padrão | ||
Mês 0 - Grupo 1
|
250.9049 | 10.8059 | 251.1166 | 10.6206 | |
Mês 0 - Grupo 2
|
270.3726 | 10.8059 | 270.1609 | 10.6206 | |
Inclinação - Mês ≤ 4 | 37.923 | 1.8409 | 37.923 | 1.8412 | |
Inclinação - Grupo 1
|
-9.1949 | 1.3279 | -9.1967 | 1.3266 | |
Inclinação - Grupo 2
|
1.3651 | 1.3279 | 1.3669 | 1.3266 | |
σId-0 | 65.7636 |
|
63.7719 |
|
|
σId-1 | 0.4216 |
|
0 |
|
|
σ | 62.7982 |
|
62.8239 |
|
Nas análises gráficas de resíduos verificamos que ambos os modelos ajustaram satisfatóriamente
Medidas de comparação dos modelos
Modelo 3 | Modelo 4 | |||||||
---|---|---|---|---|---|---|---|---|
AIC | BIC | logLik | REML | AIC | BIC | logLik | REML | |
7985.9721 | 8026.9318 | -3983.986 | 7967.9721 | 7984.3992 | 8020.8079 | -3984.1996 | 7968.3992 |
O AIC, BIC e REML são critérios do tipo menor é melhor, já a log verossimilhança é do tipo maior é melhor
Pelo AIC e BIC ficamos com o modelo 4, pela log-verossimilhança e REML ficamos com o modelo 3. Não obstante o modelo 3 possui um parâmetro a mais, e o ganho na verossimilhança parece ser pequeno dado o acréscimo de um parâmetro
anova(lm.idm, lm2.idm)
Data: data
Models:
lm2.idm: CD4 ~ Meses + tMeses * Grupo + ((1 | Id) + (0 + Meses | Id))
lm.idm: CD4 ~ Meses + tMeses * Grupo + (Meses | Id)
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm2.idm 8 8004.5 8040.9 -3994.3 7988.5
lm.idm 9 8006.1 8047.1 -3994.0 7988.1 0.4289 1 0.5125
Fazendo um teste de razão de verossimilhança ficamos com o modelo 4
Contudo, já vimos que o modelo 1 (sem inclinação aleatória até o ponto de quebra) se mostra mais adequado que os modelos 3 e 4
\[ \begin{align} {\rm CD4}_{ij} & = \mu + \beta_{m} {\rm Meses}_{i} + \beta_{t} {\rm tMeses}_{i} + \beta_{g} {\rm Grupo}_{j} + \beta_{tg} {\rm tMeses}_{i} \cdot {\rm Grupo}_{j} \\ & + \gamma_{j}^{0} + \gamma_{j}^{1} {\rm tMeses}_{i} + \epsilon_{ij} \end{align} \]
onde \(i\) indexa o mês e \(j\) indexa o indivíduo
O que diferencia esse modelo do modelo 1 é o acréscimo de mais um termo de efeito aleatório
# lm.idt: modelo linear com efeito aleatório de indivíduo (intercepto aleatório)
# e de indivíduo dentro de tmeses (inclinação aleatória depois do ponto de quebra)
lm.idt <- lmer(CD4 ~ Meses + tMeses*Grupo + (tMeses|Id), data)
Verificação dos pressupostos e ajuste do modelo
O ajuste do modelo se mostra satisfatório e os pressupostos são atendidos
Estimativas de efeito fixo do modelo em células/mm\(^{3}\)
Estimativa | Erro padrão | |
---|---|---|
Mês 0 - Grupo 1
|
251.1166 | 10.7994 |
Mês 0 - Grupo 2
|
270.1609 | 10.7994 |
Inclinação - Mês ≤ 4 | 37.923 | 1.84 |
Inclinação - Grupo 1
|
-9.1967 | 1.3299 |
Inclinação - Grupo 2
|
1.3669 | 1.3299 |
Considerar um efeito aleatório dos indivíduos e dos indivíduos dentro de
tMeses
significa inserir um diferente intercepto e inclinação depois do ponto de quebra para cada indivíduo
VarCorr(lm.idt)
Groups Name Std.Dev. Corr
Id (Intercept) 65.27149
tMeses 0.74659 -1.000
Residual 62.78243
Atente para o valor da correlação estimada entre o intercepto e a inclinação aleatórios. A estimativa é de -1
Isso mostra que o intercepto e a inclinação são altamente correlacionados e que essa correlação é negativa, i.e., para baixos valores de um deles temos altos valores do outro
anova(lm.idt, lm.id)
Data: data
Models:
lm.id: CD4 ~ Meses + tMeses * Grupo + (1 | Id)
lm.idt: CD4 ~ Meses + tMeses * Grupo + (tMeses | Id)
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm.id 7 8002.5 8034.4 -3994.3 7988.5
lm.idt 9 8005.8 8046.8 -3993.9 7987.8 0.6938 2 0.7069
Com um teste de razão de verossimilhança comparamos o modelo 5 com o modelo 1
Observe que ficamos com o modelo 1, i.e., sem a inclinação aleatória depois do ponto de quebra
Podemos escrever o modelo 5 considerando que o intercepto e a inclinação aleatórios são não correlacionados
# lm2.idt: modelo linear com efeito aleatório de indivíduo (intercepto aleatório)
# e de indivíduo dentro de meses (inclinação aleatória depois do ponto de quebra)
# não correlacionados
lm2.idt <- lmer(CD4 ~ Meses + tMeses*Grupo + (tMeses||Id), data)
Verificação dos pressupostos e ajuste do modelo
O ajuste do modelo se mostra satisfatório e os pressupostos são atendidos
Estimativas do modelo
Estimativa | Erro padrão | |
---|---|---|
Mês 0 - Grupo 1
|
251.1166 | 10.6206 |
Mês 0 - Grupo 2
|
270.1609 | 10.6206 |
Inclinação - Mês ≤ 4 | 37.923 | 1.8412 |
Inclinação - Grupo 1
|
-9.1967 | 1.3266 |
Inclinação - Grupo 2
|
1.3669 | 1.3266 |
σId-0 | 63.7719 |
|
σId-1 | 0 |
|
σ | 62.8239 |
|
Os valores das estimativas são idênticas as obtidas com o modelo 1
A única diferença é o desvio padrão da inclinação depois do ponto de quebra, sua estimativa pontual é de zero
Essa estimativa nula nos diz que a presença deste coeficiente é desnecessária, já que a princípio ele não agrega na explicação da variabilidade e que as variações na inclinação dos indivíduos é sempre a mesma, 0
Esse último gráfico é idêntico ao obtido com o modelo 1
anova(lm2.idt, lm.id)
Data: data
Models:
lm.id: CD4 ~ Meses + tMeses * Grupo + (1 | Id)
lm2.idt: CD4 ~ Meses + tMeses * Grupo + ((1 | Id) + (0 + tMeses | Id))
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm.id 7 8002.5 8034.4 -3994.3 7988.5
lm2.idt 8 8004.5 8040.9 -3994.3 7988.5 0 1 1
Com um teste de razão de verossimilhança comparamos o modelo 6 com o modelo 1, eles diferem pela inserção de uma inclinação aleatória depois do ponto de quebra
Observe que ficamos com o modelo 1, i.e., sem a inclinação aleatória até o ponto de quebra
Comparando as estimativas de contagens de CD4
dos dois modelos
Modelo 3 | Modelo 4 | ||||
---|---|---|---|---|---|
Estimativa | Erro padrão | Estimativa | Erro padrão | ||
Mês 0 - Grupo 1
|
251.1166 | 10.7994 | 251.1166 | 10.6206 | |
Mês 0 - Grupo 2
|
270.1609 | 10.7994 | 270.1609 | 10.6206 | |
Inclinação - Mês ≤ 4 | 37.923 | 1.84 | 37.923 | 1.8412 | |
Inclinação - Grupo 1
|
-9.1967 | 1.3299 | -9.1967 | 1.3266 | |
Inclinação - Grupo 2
|
1.3669 | 1.3299 | 1.3669 | 1.3266 | |
σId-0 | 65.2715 |
|
63.7719 |
|
|
σId-1 | 0.7466 |
|
0 |
|
|
σ | 62.7824 |
|
62.8239 |
|
Nas análises gráficas de resíduos verificamos que ambos os modelos ajustaram satisfatóriamente
Medidas de comparação dos modelos
Modelo 5 | Modelo 6 | |||||||
---|---|---|---|---|---|---|---|---|
AIC | BIC | logLik | REML | AIC | BIC | logLik | REML | |
7985.7075 | 8026.6672 | -3983.8537 | 7967.7075 | 7984.3992 | 8020.8079 | -3984.1996 | 7968.3992 |
O AIC, BIC e REML são critérios do tipo menor é melhor, já a log verossimilhança é do tipo maior é melhor
Pelo AIC e BIC ficamos com o modelo 6, pela log-verossimilhança e REML ficamos com o modelo 5. Não obstante o modelo 5 possui um parâmetro a mais, e o ganho na verossimilhança parece ser pequeno dado o acréscimo de um parâmetro
anova(lm.idt, lm2.idt)
Data: data
Models:
lm2.idt: CD4 ~ Meses + tMeses * Grupo + ((1 | Id) + (0 + tMeses | Id))
lm.idt: CD4 ~ Meses + tMeses * Grupo + (tMeses | Id)
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm2.idt 8 8004.5 8040.9 -3994.3 7988.5
lm.idt 9 8005.8 8046.8 -3993.9 7987.8 0.6938 1 0.4049
Fazendo um teste de razão de verossimilhança ficamos com o modelo 5
Contudo, já vimos que o modelo 1 (sem inclinação aleatória depois do ponto de quebra) se mostra mais adequado que os modelos 5 e 6
Por enquanto ficamos com o modelo 1, i.e., ficamos com o modelo apenas com o intercepto aleatório
Até agora estamos ajustando retas, mas podemos pensar numa curva quadrática até o ponto de quebra
\[ \begin{align} {\rm CD4}_{ij} & = \mu + \beta_{m} {\rm Meses}_{i} + \beta_{t2} {\rm Meses}_{i}^{2} + \beta_{t} {\rm tMeses}_{i} + \beta_{g} {\rm Grupo}_{j} + \beta_{tg} {\rm tMeses}_{i} \cdot {\rm Grupo}_{j} \\ & + \gamma_{j}^{0} + \epsilon_{ij} \end{align} \]
onde \(i\) indexa o mês e \(j\) indexa o indivíduo
# lm.id2: modelo linear com efeito aleatório de indivíduo (intercepto aleatório)
# e termo quadrático até o ponto de quebra
lm.id2 <- lmer(CD4 ~ Meses + I(Meses**2) + tMeses*Grupo + (1|Id), data)
Verificação dos pressupostos e ajuste do modelo
O ajuste do modelo se mostra satisfatório e os pressupostos são atendidos
Observamos o mesmo comportamento dos demais gráficos, isso nos diz que o termo quadrático não é significativo
Estimativas do modelo em células/mm\(^{3}\)
Estimativa | Erro padrão | |
---|---|---|
Mês 0 - Grupo 1
|
251.1042 | 10.6237 |
Mês 0 - Grupo 2
|
270.1485 | 10.6237 |
Inclinação (x) - Mês ≤ 4 | 37.9872 | 2.0622 |
Inclinação (x²) - Mês ≤ 4 | -0.0307 | 0.4426 |
Inclinação - Grupo 1
|
-8.7274 | 6.8969 |
Inclinação - Grupo 2
|
1.8362 | 6.8969 |
σId | 63.7645 |
|
σ | 62.8763 |
|
anova(lm.id2, lm.id)
Data: data
Models:
lm.id: CD4 ~ Meses + tMeses * Grupo + (1 | Id)
lm.id2: CD4 ~ Meses + I(Meses^2) + tMeses * Grupo + (1 | Id)
Df AIC BIC logLik deviance Chisq Chi Df Pr(>Chisq)
lm.id 7 8002.5 8034.4 -3994.3 7988.5
lm.id2 8 8004.5 8040.9 -3994.3 7988.5 0.0048 1 0.9445
Com o teste de razão de verossimilhança temos a confirmação de que a inserção do termo quadrático não é estatísticamente significativa, i.e., os dados são melhores descritos pela reta até o ponto de quebra