Dependência de drogas

Garcia-Mijares, Miriam; Silva, Maria Teresa Araujo

Serviços Personalizados

artigo

Tradução automática

Indicadores

Acessos

Mais
Mais

Permalink

Psicologia USP

versão On-line ISSN 1678-5177

Psicol. USP v.17 n.4 São Paulo dez. 2006

ARTIGOS ORIGINAIS

Dependência de drogas¹

Drug dependence

La dépendance de drogues

Miriam Garcia-Mijares²; Maria Teresa Araujo Silva³

Universidade de São Paulo - USP

RESUMO

O texto discute três teorias atuais de dependência de drogas: a Teoria Comportamental da dependência como escolha de Heyman, a Teoria da Sensibilização do incentivo de Robinson e Berridge, e a Teoria Neurobiológica da dependência como escolha, de Kalivas. Todas concordam em caracterizar a dependência como resultante de processos de aprendizagem em que droga e estímulos associados a seus efeitos adquirem controle potente sobre o comportamento. Diferenciam-se quanto aos processos de aprendizagem envolvidos. A Teoria Comportamental enfatiza componentes operantes e sustenta que o consumo repetido de drogas diminui o valor reforçador de atividades concorrentes. A Teoria da Sensibilização enfatiza componentes respondentes, propondo a dependência como resultado da sensibilização da potência eliciadora de estímulos condicionados aos efeitos da droga. A Teoria Neurobiológica integra as duas primeiras, descrevendo as mudanças no circuito do reforço que acontecem no processo de dependência.

Palavras-chave: Droga (dependência). Comportamento de escolha. Sensibilização. Incentivos.

ABSTRACT

This paper analyses three current theories about drug dependence: Heyman´s Behavioral Theory of dependence as choice, Robinson and Berridge´s incentive-Sensitization Theory, and Kalivas´ Neurobiological Theory of dependence as choice. All of them agree in defining dependence as a phenomenon resulting from learning processes in which drug and associated stimuli acquire powerful control over behavior. The three theories diverge as to the specific learning processes that could explain dependence. The Behavioral Theory emphasizes the operant component, sustaining that repeated ingestion of a drug reduces the reinforcing value of concurrent activities. Incentive-sensitization theory gives priority to the respondent component, advancing that dependence results from sensitization of the eliciting power of stimuli associated to the drug effect. The Neurobiological Theory integrates the former two by describing the changes that occur in the reinforcement circuit as dependence develops.

Keywords: Drug dependency. Choice behavior. Sensitization. Incentives.

RÉSUMÉ

Cet article analyse trois théories courantes au sujet de la dépendance de drogues: la Théorie Comportementale de dépendance comme choix de Heyman, la Théorie de Sensibilization de l´incentive de Robinson et Berridge, et la Théorie Neurobiologique de dépendance comme choix de Kalivas. Tous conviennent en définissant la dépendance comme phénomène résultant d´un procès d´apprentissage par lequel la drogue et les stimuli associés a ses effets acquièrent un contrôle puissant sur le comportement mais divergent quant aux apprentissages spécifiques qui expliquent la dépendance. La Théorie Comportementale souligne le composant operant, soutenant que l'ingestion répétée d'une drogue réduit la valeur de renforcement des activités concourantes. La Théorie de Sensibilization accorde la priorité au composant répondant, avançant que la dépendance résulte de la sensibilisation de la puissance des stimuli associés à l'effet de la drogue. La Théorie Neurobiologique de la dépendance comme choix intègre les autres deux, en décrivant les changements qui se produisent dans le circuit de renforcement pendant que la dépendance se développe.

Mots-clés: Dépendance de drogues. Comportement de choix. Sensibilization. Incentive.

“Dependentes são aqueles que planejam
usar drogas de forma descontrolada”
(Heyman)

O Manual Diagnóstico e Estatístico de Transtornos Mentais (DSM-IV) define a dependência como um conjunto de sintomas que indicam que uma pessoa usa compulsivamente uma ou mais substâncias apesar dos problemas que esse comportamento possa estar lhe causando. Ou seja, é um comportamento que escapa ao controle do indivíduo. Porém, os comportamentos de procura e de auto-administração de drogas não são automáticos nem inatos, porém aprendidos, e requerem planejamento. Dessa forma, pareceria paradoxal afirmar que um comportamento que escapa do controle do indivíduo possa ser aprendido e planejado. Esse aparente paradoxo resulta da suposição, implícita na definição de dependência, de que as pessoas, quando saudáveis, são livres para escolher seus comportamentos, ou seja, que o controle do comportamento encontra-se dentro do indivíduo. Esse pressuposto marcou as primeiras definições de dependência.

História

Antes do século 19, a dependência era considerada uma deficiência de caráter. Os dependentes consumiam a droga porque gostavam de fazê-lo, escolhiam ser “indecentes”, “pecaminosos”, ou seja, tinham o poder de decidir se ingeriam ou não a droga, mas por serem de baixa moral, preferiam ingeri-la (McKim, 2004). Movimentos de reforma social no século 19 mudaram essa concepção. Entre eles, está a formação da Associação Americana para a cura dos Embriagados (The Amerian Association for the cure of Inebriates) que, apoiada por médicos e legisladores, divulgava que a dependência era uma doença e que os adictos deveriam ser tratados como vítimas e não como criminosos ou pecadores. O modelo da dependência como doença ganhou sua maior força no século 20, com a formação do movimento de Alcoólicos Anônimos, e com o trabalho de um dos seus mais importantes teóricos e pesquisadores, E. M. Jellinek. Jellinek (1952, 1960, citado por Heyman, 1996) publicou uma série de artigos defendendo que o alcoolismo era uma doença. O autor distinguia usuários que perdiam o controle sobre o consumo do álcool -“alcohol addicts”- daqueles que habitualmente consumiam muito álcool, mas não perdiam o controle sobre seu consumo - “habitual symptomatic excessive drinkers”. Para Jellinek (1952, 1960, citado por Heyman, 1996), apenas o primeiro (perda de controle sobre o consumo) deveria ser tratado como doente. Em 1952 a Organização Mundial da Saúde (OMS) apoiou a concepção de Jellinek, definindo o alcoolismo como doença e dando por subentendido que todas as outras formas de dependência de drogas eram também doenças.

A visão da dependência de drogas como doença prevalece fortemente nos dias de hoje. O DSM-IV substituiu a palavra “doença” por “transtorno”, mas a segunda tem como significado implícito a primeira. O que é mais, a distinção entre adicção e consumo excessivo proposta por Jellinek é usada no DSM-IV sob os termos “dependência” e “abuso”, respectivamente. Dessa forma, “a perda de controle” continua sendo a premissa fundamental que define a dependência como doença.

Uma vez estabelecida como doença, então se fez necessário caracterizar sua etiologia. De um lado surgiram as pesquisas sobre herança genética da dependência. Essas pesquisas mostraram, por exemplo, que filhos de alcoolistas adotados tinham maior probabilidade de desenvolver alcoolismo, e que a coincidência de alcoolismo entre irmãos gêmeos era de 70% (Heyman, 1996). Assim, o achado de que a dependência era herdada fortalecia a hipótese de que era uma doença cuja origem estaria nos genes. Mas como a perda de controle sobre o consumo de uma droga seria herdada? Tal como aponta Heyman (1996), a primeira questão a ser resolvida para responder essa pergunta seria: O quê é o herdado? Por exemplo, existem evidências que indicam que a herança do alcoolismo está associada à procura de emoções (novelty seeking) e à sensibilidade alta a baixas doses de álcool (Schuckit, 1994). Esses traços aumentam a probabilidade de desenvolver dependência de álcool, mas não são determinantes do comportamento de beber: “em vez disso, beber álcool é um conjunto de comportamentos aprendidos, instrumentais. Isso sugere que o que é herdado são os fatores que influenciam a decisão de beber, não o beber por sim mesmo” (Heyman, 1996, p. 576).

Outras evidências, experimentais e teóricas, sobre a etiologia da doença dependência provêm do modelo de dependência física. Inicialmente esse modelo foi desenvolvido independentemente do modelo de doença, porém, como será visto em breve, atualmente é visto como parte dele por alguns autores. Na sua primeira elaboração, o modelo de dependência física sustentava que a administração repetida da droga produzia mudanças fisiológicas relativamente permanentes no organismo (tolerância) como forma de contrabalançar os efeitos perturbadores da droga. Assim, quando a droga é retirada do organismo (abstinência), aparece uma série de sintomas opostos aos produzidos pela droga (síndrome de abstinência). Esses sintomas são freqüentemente muito aversivos, o que levaria o consumidor em abstinência a procurar a droga como uma forma de aliviá-los. Essa primeira elaboração como explicação única da dependência mostrou-se insuficiente, devido às pesquisas que mostraram que drogas como a cocaína ou a anfetamina não produziam sintomas de abstinência graves. Desenvolveu-se então outro conceito, o de dependência psicológica, segundo o qual sintomas de abstinência psicológicos não observados explicariam a dependência em relação a essas drogas. Esses sintomas psicológicos levariam a um estado de motivação alta e incontrolável para o consumo da droga.

Com o desenvolvimento tecnológico e teórico das neurociências, o modelo de dependência física/psicológica mudou. A descoberta dos sistemas neurofisiológicos alterados pelas drogas adictivas, dos sistemas associados ao reforço e dos mecanismos dessas alterações, levou aos chamados modelos psicobiológicos, psicofisiológicos ou neuropsicológicos da dependência. Na sua versão mais extrema, o modelo psicobiológico perde completamente o “psico”, sendo apenas neurofisiológico, defendendo que a dependência é uma doença causada apenas pelas mudanças celulares e moleculares que as drogas causam no cérebro:

a doença da adicção é produzida pela administração crônica das próprias drogas, que causam alterações moleculares de longo prazo nas propriedades de sinalização das células nervosas (neurônios). Em particular as drogas de abuso parecem comandar circuitos intimamente envolvidos no controle da emoção e motivação, diminuindo a introspecção e até a volição da pessoa adicta. (Hyman, 1995, p. 30)

Os defensores dessa posição caracterizam a dependência como uma doença do cérebro: “Que a adicção esteja ligada a mudanças na estrutura e função do cérebro é o que a faz, fundamentalmente, uma doença do cérebro” (Leshner, 1997, p. 46). Assim, a dependência fica definida como “uma doença do cérebro que causa perda de controle sobre o uso da droga”. E os modelos de doença e físico/psicológico ficam integrados em um modelo só.

Ainda que no modelo neurofisiológico os fatores psicológicos e sociais da dependência não sejam desprezados, seu papel é diminuído ou simplificado. Por exemplo, Torres e Horowitz (1999) reconhecem que, além dos fatores gênicos (referidos às mudanças produzidas por drogas na expressão gênica de células nervosas), existem também fatores sociais, mas eles teriam impacto apenas naquelas características genéticas associadas a fenótipos com “tendência à droga”. O fator psicológico é tratado como conseqüência: as mudanças que a droga causa no cérebro produzem alterações no comportamento (auto-administração compulsiva, perda de controle), mas é reconhecido que abordagens comportamentais são eficazes no tratamento da doença, na medida em que tratamentos comportamentais têm mostrado mudar funções cerebrais (Leshner, 1997).

Ainda que seja indiscutível a grande importância das mudanças produzidas no cérebro para entender a dependência, o modelo neurofisiológico resulta incompleto para explicar a aquisição, manutenção e recaída na adicção. Por exemplo, não explica por que pacientes que recebem morfina cronicamente como analgésico não desenvolvem dependência, enquanto que aqueles que auto-administram a droga manifestam forte adicção (Melzack, 1990). Também não integra o volumoso corpo de dados que mostra que manipulações ambientais alteram o efeito de drogas sobre o comportamento, como também o desenvolvimento da dependência. Por último, e quiçá a maior objeção, não resolve o paradoxo colocado no início desta discussão: como um comportamento que escapa do controle do indivíduo pode ser aprendido e planejado.

O modelo neurofisiológico não consegue explicar esse paradoxo porque, assim como o modelo de doença tradicional, considera que a dependência é um estado interno do indivíduo e que, portanto, para curar essa doença a solução é mexer dentro do indivíduo. A hipótese básica é que se fosse possível mudar o cérebro do sujeito dependente para o estado original, então a doença poderia ser curada. Assim as drogas, via cérebro, causam a perda de controle (o comportamento passa a ser involuntário) sobre seu uso, e via cérebro esse controle pode ser devolvido. Porém o comportamento de auto-administração de drogas começa bem antes de estar a droga dentro do organismo e é um comportamento instrumental. Assim, ficaria a questão de como podem ser involuntários comportamentos instrumentais que por definição são voluntários. Ou seja, a contradição continua.

O paradoxo é resolvido quando o controle atribuído à pessoa é colocado no ambiente. A posição tradicional sobre um comportamento ser voluntário ou involuntário está associada à noção de liberdade de escolha, ao controle sobre os próprios atos. Porém, já em 1953 o comportamento voluntário fora definido por Skinner em função dos seus determinantes ambientais (Skinner, 1953). Para esse eminente behaviorista, os comportamentos voluntários são controlados por suas conseqüências (estímulos reforçadores), e os comportamentos involuntários por estímulos eliciadores. Esses estímulos eliciadores seriam incondicionados (não aprendidos) ou condicionados (aprendidos). Sabe-se atualmente que essa distinção não é tão clara, pois na prática é muito difícil distinguir as influências sobre o comportamento dos estímulos eliciadores da influência dos estímulos reforçadores (Donahoe & Palmer, 1994; Rescorla, 1988). Contudo, a posição de que o comportamento é controlado pelo ambiente continua sendo a premissa fundamental da Análise do Comportamento (AC).

Na teoria comportamental, todo comportamento é conseqüência da interação do indivíduo com seu ambiente. O comportamento de auto-administração de drogas, característico da dependência, é também então resultado dessa interação:

O comportamento do drogadicto obedece às mesmas leis do comportamento “normal” de todos os animais... São os eventos ambientais que determinam o comportamento, e não a consciência e autocontrole; assim, aqui não tem sentido a consideração da falta de controle voluntário do drogadicto sobre seu comportamento compulsivo, ou de características morais da sua personalidade. Na abordagem comportamental, a adicção e a dependência geram um comportamento inadequado e lesivo, mas não desviante. (Silva, Guerra, Gonçalves, & Garcia-Mijares, 2001, p. 424)

Em outras palavras, em uma análise comportamental os comportamentos característicos da dependência, como uso compulsivo e consumo maior do que o pretendido, são comportamentos que podem ser entendidos sob os mesmos princípios gerais que explicam outros comportamentos. A droga é então definida como um estímulo cuja função dependerá das conseqüências que produz e/ou do contexto em que é administrada. Por exemplo, pode funcionar como reforçador positivo, ou seja, aumentar a probabilidade de resposta do comportamento de auto-administração pelos efeitos que produz; ou como reforçador negativo, como no caso da auto-administração gerada pelo alívio dos sintomas de abstinência. Outros estímulos ambientais como o esquema de reforço e pareamento do efeito da droga com contextos específicos, entre outros, modulariam essa função. Por exemplo, estímulos ambientais associados ao efeito da droga poderiam eliciar a “fissura” pela droga. Essa posição comportamental tem sido freqüentemente chamada de “modelo do reforço” da dependência.

O paradoxo pareceria então resolvido. Se o controle não está no sujeito, mas nas conseqüências de consumir a droga, a dependência não é definida nem como doença, nem como perda de controle do sujeito sobre seu comportamento, e sim como um comportamento que teve sua probabilidade aumentada porque foi reforçado, e que é mantido pela mesma razão.

Contudo, tal como aponta McKim (2004), o modelo do reforço apresenta um sério problema: usar o reforço como explicação da auto-administração da droga é uma explicação circular. Esse problema já foi apontado por outros autores, em relação ao uso do reforço como explicação do comportamento (por exemplo, Skinner, 1966) e pode ser colocado desta forma: se uma droga é definida como reforçador positivo porque aumenta a probabilidade do comportamento da sua auto-administração, então, dizer que o comportamento de auto-administração acontece porque é reforçado pela droga é uma tautologia, porque usa a própria definição como explicação. Uma forma de resolver esse problema seria explicar o reforço sem incluir seus efeitos sobre o comportamento; por exemplo, o reforço pode ser explicado pelas suas conseqüências sobre o sistema nervoso. Isto será posteriormente detalhado na discussão das bases neurais da dependência.

Um outro problema do modelo do reforço é apontado por Heyman (1996) e McKim (2004), que chamam a atenção sobre o fato de que se bem é certo que o modelo comportamental consegue explicar o comportamento de abuso de drogas, não consegue explicar o de dependência. Segundo a AC, o comportamento não é apenas controlado por reforçadores, mas também por punidores e, por definição, um punidor diminui a probabilidade da resposta que o produziu. No caso da dependência os punidores podem ser tão ou mais poderosos que os primeiros, já que as conseqüências negativas sobre a saúde, o trabalho e a interação social aumentam na medida que o sujeito usa mais a droga. Assim um novo paradoxo aparece: Porque o comportamento de auto-administração da droga aumenta mesmo quando suas conseqüências negativas podem chegar a superar as positivas? Duas teorias, a teoria de escolha de Heyman (1996) e a teoria da sensibilização do incentivo de Robinson e Berridge propõem resolver essa questão⁴.

Teoria Comportamental da Dependência de Drogas como Escolha

Uma situação de escolha pode ser definida como uma situação ambiental na qual mais de uma alternativa de resposta está disponível, o que corresponde a qualquer situação em que o comportamento possa variar (Rachlin, 1997). Considerando que em uma situação de escolha um comportamento é emitido em detrimento de outro, e que os organismos estão continuamente se comportando, então “não é exagero dizer que todo comportamento envolve uma escolha” (de Villiers & Herrnstein, 1976). Portanto, o estudo de um comportamento não deve envolver apenas os reforçadores e estímulos associados a ele, mas também os comportamentos concorrentes e seus reforçadores.

Lei de Igualação

Em 1961, Herrnstein mostrou que pombos sob esquemas concorrentes de reforço tendiam a distribuir suas respostas entre as diferentes alternativas seguindo um padrão que denominou de “Lei da Igualação”. A Lei da Igualação estabelece que, em uma situação de escolha, a proporção de respostas em cada uma das alternativas igualará a proporção de reforços nessa mesma alternativa. Um número considerável de pesquisas provou que a lei da igualação se estende a outras propriedades do reforço, além da taxa; por exemplo, mostrou-se igualação entre o tempo relativo da resposta e a freqüência relativa de reforços, entre a magnitude relativa do reforço e a taxa de respostas, e entre o atraso relativo do reforço e a taxa de respostas (de Villiers & Herrnstein, 1976). Igualmente essa relação tem se mostrado válida no laboratório e em ambientes naturais e com várias espécies, incluindo seres humanos (Baum, 1974; de Villiers, 1983; McDowell, 1988). Essa generalidade mostra que a igualação não é produto de arranjos experimentais específicos, mas uma propriedade do comportamento.

A Lei da Igualação é uma lei molar, ou seja, ela prediz como os organismos distribuirão seus comportamentos entre várias alternativas ao longo de um período de tempo. Contudo, ela não prediz qual será a escolha do organismo em um momento determinado. Herrnstein e Vaughan (1980) propuseram o termo de “melhoração” para descrever a estratégia usada por animais e humanos no momento da escolha. Segundo os autores, os organismos vão dedicar maior quantidade de tempo e/ou esforço às alternativas das quais se obtém o maior “benefício” no momento, isto é, naquelas alternativas que possuem a maior taxa local de reforço. O produto final da melhoração, ao longo do tempo, seria a igualação.

Outra estratégia proposta para explicar a escolha momento a momento é a da “otimização” ou “maximização”. A maximização prediz que os sujeitos escolherão a alternativa que no longo prazo possua o melhor valor “custo-benefício” (Rachlin, 1976, 1997). Para determinar qual alternativa possui o maior valor de “custo-benefício” os organismos seguem regras de decisão baseados nas possíveis conseqüências futuras dessa decisão, como por exemplo o valor do reforço futuro, o esforço envolvido em responder e o valor das outras respostas (Rachlin, 1976). Dessa forma, a escolha não é feita em relação a uma alternativa sobre a outra, mas sobre a melhor combinação de alternativas.

Note-se que para ambas as estratégias a regra de decisão é a mesma, ou seja, a de que o organismo escolherá a melhor opção. A diferença fundamental entre ambas é que para a maximização a escolha atual é feita com base no valor que o reforçador terá no futuro, enquanto que para a melhoração a escolha é feita com base no valor atual do reforçador. Outra diferença é que o resultado final da maximização é a obtenção da maior quantidade de reforço possível em um período de tempo, enquanto que o retorno da melhoração, por basear-se em uma regra local, nem sempre é o ótimo. Segundo Herrnstein e Prelec (1992), as pessoas usam o principio de melhoração em muitas das suas decisões do dia a dia, o que traz como conseqüência que elas nem sempre sejam ótimas. A dependência de drogas seria um exemplo disso.

Dependência de drogas como escolha

Heyman (1996) desenvolveu um modelo teórico mostrando como a dependência de drogas segue o padrão predito pela estratégia de melhoração. Para esse autor, a dependência pode ser entendida como um processo em que o consumo repetido de uma droga ocasiona a diminuição progressiva do valor reforçador de atividades como família, trabalho, etc., em relação a atividades relacionadas com o consumo de droga. Segundo o modelo, o valor reforçador da droga também diminui nesse processo, porém em menor magnitude do que o das atividades concorrentes.

Sob essa perspectiva, dependentes de droga se diferenciam de usuários não dependentes pelo tipo de estratégia de escolha que controla seu comportamento. Dependentes são controlados pelo valor reforçador local, imediato, do consumo da droga que, como foi colocado, é maior do que o valor reforçador local das outras atividades. Dependentes, então, usam como estratégia a melhoração. Usuários não dependentes, por outro lado, maximizam, pois são controlados pelo valor reforçador combinado da droga e das atividades concorrentes, tanto local quanto futuro.

Heyman (1996) afirma que esse modelo explicaria os comportamentos de uso compulsivo da droga e de “perda de controle” característicos da dependência. Quando a preferência encontra-se sob controle da estratégia de maximização (a obtenção da maior quantidade de reforços), o sujeito escolherá menos vezes usar a droga e mais vezes fazer outras atividades; mas se a regra for a de melhoração, então ele optará pela droga mais vezes, ou seja, mostrará um padrão de dependência.

O que então determinaria que uma ou outra estratégia “assuma o controle”? Segundo o autor a evidência empírica indica que, quando as conseqüências do comportamento são mais remotas no tempo, a eficácia da função de maximização aumenta, mas quando o reforço é mais imediato, aumenta a eficácia da função de melhoração. Nesse sentido, as contingências que governam a escolha podem variar e com elas a preferência, independentemente das propriedades das alternativas concorrentes.

A teoria da dependência de drogas como escolha, semelhante ao modelo do reforço, supõe que as regras usadas para explicar outros comportamentos são as mesmas que explicam o comportamento do dependente; porém, diferentemente do primeiro, o modelo de escolha explica a dependência em termos da relação de concorrência entre consumo da droga e outras atividades. Também se diferencia por considerar as drogas como estímulos com propriedades reforçadoras diferentes de outros reforçadores naturais típicos como água, comida, entre outros. De fato, a igualação e maximização não costumam resultar em comportamentos compulsivos quando as alternativas são esses reforçadores naturais. Então, essa característica das drogas de diminuir o valor reforçador de outras atividades seria o fator que levaria à dependência: comida, esporte, trabalho, por exemplo, não diminuem o valor reforçador de atividades concorrentes, antes o aumentam. Outras características ainda diferenciam as drogas de reforçadores convencionais: seus efeitos imediatos, demora em produzir saciação, abstinência e produção de mudanças pronunciadas no sistema nervoso central. As drogas portanto agiriam como reforçadores atípicos porque produzem comportamentos pouco adaptados através de processos que tipicamente são adaptativos.

Uma limitação da teoria da dependência de Heyman (1996) é não explicar o papel de aprendizados respondentes no comportamento do dependente, assim como também não integrar formalmente a informação obtida das neurociências sobre as mudanças produzidas pela administração repetida de drogas no sistema nervoso central. Outra teoria sobre dependência, a “Teoria da Sensibilização do Incentivo”, proposta por Robinson e Berridge (1993, 2001, 2003), também presume que as drogas são estímulos atípicos que alteram processos adaptativos, mas tenta integrar os conhecimentos das neurociências sobre dependência com os conhecimentos derivados da psicologia comportamental.

Teoria da Sensibilização do Incentivo

A Teoria da Sensibilização do Incentivo” pode ser resumida em 5 pontos básicos:

1. Os sistemas associados ao núcleo accumbens (Nac) medeiam funções básicas motivacionais do incentivo⁵. Especificamente, são responsáveis pela saliência⁶ dos estímulos. A administração repetida de drogas causa mudanças no cérebro (sensibilização neural), e como conseqüência disso, esses sistemas ficam hipersensíveis a efeitos específicos da droga, e a estímulos associados a eles.

2. A sensibilização neural produz mudanças psicológicas que fazem que as representações⁷ associadas à droga tenham uma excessiva saliência, acarretando com isso um “querer” (wanting) patológico da droga. Esse “querer” é definido como a ativação de processos neurais relacionados com a saliência do estímulo.

3. A ativação desses sistemas sensibilizados, ou seja, dos sistemas que atribuem a saliência dos estímulos associados à droga, pode se expressar em fissura pela droga e em comportamentos de procura da droga (“querer”), sem que a pessoa tenha emoções, desejos ou objetivos conscientes dessa procura.

4. Os sistemas sensibilizados responsáveis pela excessiva saliência dos estímulos são diferentes daqueles que medeiam os efeitos hedônicos ou euforizantes das drogas, ou seja, daqueles associados a quanto o indivíduo “gosta” das drogas. Em outras palavras, “querer” é diferente de “gostar” (liking) e ambos são diferentes processos psicológicos com diferentes substratos neurais. A sensibilização neural aumenta apenas o “querer”.

5. Na dependência, o comportamento compulsivo e a vulnerabilidade à recaída são causados por esse aumento na saliência dos estímulos associados à droga. Os indivíduos dependentes são controlados por estímulos incentivadores estabelecidos por processos de associações respondentes estímulo-estímulo.

Em resumo, segundo essa teoria a dependência acontece porque os sistemas neurais responsáveis pela saliência dos estímulos são sensibilizados pela administração repetida da droga. Isso causa que o indivíduo sensibilizado, quando exposto à droga, ou a estímulos associados a ela, queira a droga mesmo não gostando dela. Como para Robinson e Berridge (1993, 2001, 2003) o “gostar” está associado a processos cognitivos, e esses processos não são sensibilizados, então o “querer” a droga pode ser irracional. Assim, a fissura pela droga, que é igualada ao “querer”, seria um processo que aconteceria mesmo quando o sujeito não gosta mais da droga. O deixar de “gostar” pode dever-se a um processo de tolerância, mas de qualquer forma esse processo não seria importante para explicar a dependência.

A teoria da sensibilização do incentivo parece responder a várias das questões relevantes sobre a dependência. Por exemplo, na discussão anterior sobre dependência, foi colocado que um dos problemas principais dos modelos de doença era a suposição de que os indivíduos controlam seu comportamento e de que uma das características principais da dependência era a perda desse controle. Em relação a isso foi discutido que os comportamentos de procura e auto-administração de droga são instrumentais, ou seja, voluntários, e que portanto a caracterização da dependência como perda de controle era um paradoxo. Foi apontado que uma forma de resolver esse paradoxo era alocar o controle do comportamento fora do indivíduo, tal como é proposto pelo modelo comportamental. O modelo da sensibilização do incentivo também coloca o controle do comportamento fora do indivíduo: estabelece que a exposição a estímulos associados à droga (CS) estimula circuitos sensibilizados ao valor de incentivo desses estímulos, o que leva à auto-administração da droga. Contudo, esse modelo se diferencia do comportamental, pois mesmo afirmando que esses estímulos adquirem seu valor de incentivo por processos de condicionamento, a causa do comportamento é atribuída à sensibilização neural e não a esses processos de aprendizagem.

A questão de por que os indivíduos dependentes continuam consumindo a droga, mesmo quando as conseqüências individuais e sociais são aversivas, também é tratada por Robinson e Berridge (1993, 2001, 2003). Se o consumo de drogas é causado apenas pelo “querer”, e o “querer” é apenas causado pela exposição à droga ou a seus estímulos condicionados, então, o consumo de drogas é um comportamento controlado pelo estímulo incondicionado (US) e pelo estímulo condicionado (CS), não pelo estímulo reforçador (SR), e portanto, não é controlado pelas suas conseqüências. Isso explicaria que os sujeitos auto-administrem a droga mesmo em face de conseqüências aversivas.

Por outro lado, mesmo respondendo a essas questões, a teoria da sensibilização do incentivo apresenta alguns problemas. O primeiro deles é o uso do termo “querer”. O querer é definido como “a ativação dos processos [neurais] associados à saliência do estímulo” (Robinson & Berridge, 2003, p. 36), mas “querer” também é considerado um processo psicológico que causa o comportamento de auto-administrar a droga; fica então difícil estabelecer a natureza e função dessa ativação ou processo, quer dizer, não fica claro se “querer” é um comportamento ou um estímulo, o que compromete seu uso como variável causal.

Outro problema dessa teoria é que ela supõe que os processos operantes não são importantes na dependência. O desenvolvimento da dependência se daria por sensibilização da circuitaria associada com a força (saliência) do US (drogas), como também do CS (estímulos ambientais pareados com a droga), e as conseqüências do comportamento resultante não teriam papel importante na dependência. Deve-se ressaltar que os autores não consideram que o consumo de droga seja uma resposta condicionada (CR), mas uma resposta operante induzida por um CS.

Papel do comportamento operante na dependência

Que uma resposta operante seja guiada e alterada por esses estímulos não é novo na AC. De fato, a maior fonte de dados sobre esse fenômeno provem de pesquisas realizadas sobre o que tem sido denominado de “revalorização”⁸. No procedimento experimental típico da revalorização ratos são treinados a bater numa barra por comida (treino). Depois desse condicionamento, a comida é administrada no mesmo local que o treino foi feito, mas sem a barra. Imediatamente depois da administração de comida, cloreto de lítio (LiCl) é administrado aos ratos (é sabido que essa substancia produz enjôo e aversão condicionada à comida com que é pareada). No dia após a sessão de aversão condicionada, a barra é colocada novamente e a resposta na barra medida (teste). O maior achado dos experimentos que usam esse arranjo experimental tem sido que os animais diminuem sensivelmente a taxa de respostas por comida no teste. Esse efeito não pode ser atribuído a possíveis CRs (náuseas) aos estímulos do local que concorram com a resposta de apertar a barra, já que, quando o treino e teste são feitos concorrentemente com outro operante (por exemplo, puxar uma avalanca) reforçado com açúcar (não pareada com o LiCl), a resposta na alavanca não sofre alteração (Colwill & Rescorla, 1985). Segundo Rescorla (1985) os resultados das pesquisas em revalorização demonstram que associações resposta-S^R efetivamente acontecem no treino operante. A lógica dessa afirmação é que as manipulações respondentes alteram o valor do estímulo reforçador levando à diminuição da taxa de resposta, o que não aconteceria se associações resposta-S^R não fossem estabelecidas na aprendizagem operante. Ainda que essa interpretação seja questionada por alguns autores⁹, é curioso que uma versão do paradigma de revalorização tenha sido usada por Wyvell & Berridge (2001) para demonstrar que o que é sensibilizado (fortalecido) na auto-administração de drogas (um operante) são apenas as relações estímulo-estímulo e não as relações resposta-estímulo.

Wyvell e Berridge (2001) sensibilizaram ratos aos efeitos da anfetamina, e treinaram os animais a pressionar uma barra, usando açúcar como reforçador. Posteriormente associaram um estímulo luminoso à administração do açúcar, sem a presença da barra. Depois desse treino a barra foi colocada de novo na caixa e foram medidas as respostas na presença do estímulo luminoso (CS+) e na ausência do estímulo luminoso (CS-), em condição de extinção. Encontraram que o grupo sensibilizado mostrava uma taxa de resposta significativamente maior do que o grupo não pré-exposto à anfetamina (grupo controle) apenas na presença do CS+. Os autores concluíram:

acreditamos que esses resultados são a mais pura demonstração até agora obtida da teoria da sensibilização do incentivo, que postula que a sensibilização aumenta a saliência do incentivo disparado pela recompensa, em um experimento que não pode ser explicado por aprendizagem associativa de recompensa ou por reforço condicionado (p. 7839).

Segundo os autores, o fato de o teste ter sido realizado em extinção eliminaria qualquer explicação operante para os resultados encontrados. O que não é discutido por Wyvell e Berridge (2001) é que seus resultados também mostraram que, embora o grupo sensibilizado tenha mostrado maior número de respostas que o grupo controle na primeira apresentação do CS+, essa resposta diminuiu rapidamente com subseqüentes apresentações desse estímulo. Já na quarta apresentação do CS+ a resposta do grupo sensibilizado retornou aos níveis de linha de base, equiparando-se às respostas dadas na situação de CS- e à taxa do grupo controle. Esses dados indicam que a ausência do reforçador primário (açúcar) controlou a resposta dos animais (extinção) e, portanto, que as conseqüências são também importantes no “querer” o açúcar.

Existem ainda dados que parecem indicar que o controle exercido sobre o comportamento por estímulos associados à administração drogas de abuso parece ser maior quando o pareamento acontece sob uma contingência operante. Ciccocioppo, Martin-Fardon e Weiss (2004) treinaram ratos (1 sessão) a autoadministrar cocaína quando um estímulo discriminativo (S^D) estava presente. Respostas em uma barra na presença de um som (o S^D) eram reforçadas com infusão de cocaína, entanto que resposta na mesma barra na presença de uma luz (o S^Δ) eram consequenciadas com infusão de salina. Após uma sessão nesse treino verificou-se que a taxa de respostas na presença do som era significativamente alta e que na presença da luz estava quase extinta. Após isso, foram realizadas cinco sessões com intervalos de três meses em que era medida a taxa de respostas de pressão de barra na presença da luz e do som, em situação de extinção. Os resultados mostraram que mesmo após nove meses de abstinência da droga os animais continuavam respondendo na barra na presença do som, entanto que na presença da luz a resposta permanecia baixa. Também interessante foi o resultado em que mostraram que quando era usado como reforçador leite condensado, em vez de cocaína, a resposta se extinguia em apenas 3 meses. Esse trabalho mostra que, tal como apontam Robinson e Berridge (1993, 2001, 2003), o controle de estímulos é importante para entender e explicar o comportamento de procura de drogas, mas também mostra que estímulos associados à droga por contingência operante mantêm um controle poderoso sobre esse comportamento.

Para finalizar, a teoria da sensibilização do incentivo tem sofrido também críticas de pesquisadores da área clínica em dependência, especialmente de Gawin e Khalsa-Denison (1996), que alegam que várias das afirmações de Robinson e Berridge (1993, 2001, 2003) não coincidem com os dados obtidos com dependentes humanos. Uma das objeções refere-se à afirmação de que a dependência não está associada aos efeitos hedônicos (gostar) da droga. Segundo Gawin e Khalsa-Denison (1996), essa noção contradiz não apenas os relatos dos dependentes, mas também os dados de pesquisa clínica que mostram que parte da eficácia terapêutica da naltrexona (antagonista opióide usado no tratamento da dependência de opiáceos) deve-se a seus efeitos bloqueadores sobre a euforia (efeito hedônico) causada pelos opiáceos. Mais ainda, parece que o desaparecimento desse efeito da naltrexona está associado ao desaparecimento da fissura:

os achados clínicos são opostos à previsão da saliência do incentivo em relação à recompensa. A fissura é quase eliminada durante o tratamento com naltrexona, mais que com qualquer outro tratamento farmacológico de dependência e, contrariamente à teoria da sensibilização do incentivo, retorna imediatamente após a suspensão da naltrexona com a percepção de que o “pico” [“high”] da droga está novamente disponível. (p. 234)

Gawin e Khalsa-Denison (1996) também citam um amplo conjunto de dados humanos que indicam que, além da fissura, fatores como disponibilidade da droga, potência “euforigênica” da droga, sintomas de abstinência, prevalência e força de estímulos associados à droga no ambiente e de reforçadores alternativos, e prevalência e força de estímulos punitivos, são importantes na determinação do comportamento de abuso de drogas em humanos. Ainda que fora desta discussão, não deixa de chamar a atenção que vários desses fatores sejam coerentes com a teoria de escolha proposta por Heyman (1996) e aqui já discutida. Por último, ainda esses autores alegam que Robinson e Berridge (1993, 2001, 2003) usaram exemplos de casos clínicos anedóticos, e sem suficiente fundamentação científica, como demonstração da aplicabilidade de sua teoria à dependência humana, o que enfraqueceria a generalidade da teoria.

Resumindo, a teoria da sensibilização do incentivo é superior a outras teorias de dependência porque explica várias das questões relevantes desse fenômeno e porque integra os conhecimentos neurofisiológicos da ação das drogas com os princípios comportamentais. Porém é incompleta, por desconsiderar os processos operantes envolvidos no comportamento do dependente, sendo seu alcance preditivo igualmente incompleto.

Teoria Neurobiológica da Dependência como Escolha

Até agora duas teorias de dependência foram discutidas, a teoria da escolha de Heyman (1996) e a teoria da sensibilização do incentivo de Robinson e Berridge (1993, 2001, 2003). Foi apontado que ambas as teorias coincidem ao caracterizar as drogas psicoativas como estímulos que agem sobre processos comportamentais adaptativos mas que, por suas peculiaridades de ação sobre o SNC, podem produzir os padrões de comportamento pouco adaptativos típicos da dependência. Uma proposta recente, desenvolvida por Peter W. Kalivas e colaboradores, parece conciliar ambas as teorias: o consumo repetido de drogas produziria mudanças no sistema nervoso em vias dopaminérgicas e glutamatérgicas especificas que ocasionam diminuição do valor reforçador de estímulos naturais, aumentam a resposta a estímulos associados com a droga e alteram com isso o comportamento de escolha (Kalivas & Hu, 2006; Kalivas, Volkow, & Seamans, 2005; Kalivas & Volkow, 2005). Da mesma forma que as duas teorias anteriores, a teoria de Kalivas e colaboradores sustenta que o mecanismo de ação das drogas sobre o SNC e sobre o comportamento é o mesmo que o de outros estímulos naturais (Kalivas & Hu, 2006; Kalivas et al., 2005; Kalivas & Volkow, 2005). É por isso que a seguir serão brevemente descritos os mecanismos anatômicos e fisiológicos envolvidos na aprendizagem associativa.

Bases neurais do comportamento aprendido

A neurobiologia de qualquer comportamento aprendido deve incluir uma série de mecanismos que, por um lado, garantam que a estimulação sensorial resulte em respostas musculares e glandulares e, por outro, “memorizem” a relação entre estímulos e respostas. A localização específica dessas áreas anatômicas sensoriais e motoras ainda não são bem conhecidas, mas sabe-se que a circuitaria sensório-motora denominada “córtico-estriatal-palidal-talamocortical” está envolvida nos processos de aprendizagem. Estímulos ambientais e respostas motoras estimulam áreas especificas do córtex sensorial ou motor. Esse sinal produz estimulação de áreas especificas do putamen, do qual saem projeções para o globo pálido, que se conecta com o tálamo. Do tálamo a informação vai para áreas especificas do córtex, fechando assim o circuito. A área anatômica estimulada em cada estrutura dependerá da natureza do estímulo (visual, auditivo etc.) e da localização da resposta motora (perna, braço, pálpebra etc.). Acredita-se que áreas associativas do cérebro estariam também interconectadas por vários circuitos que operariam em paralelo com os circuitos sensório-motores. Um circuito crítico para a aquisição e emissão de comportamentos aprendidos é o formado pelo Nac, córtex pré-frontal (CPF) e amígdala, também às vezes chamado de circuito “do reforço” ou “da motivação” (Kalivas & Nakamura, 1999).

Uma das vias do circuito do reforço amplamente estudada por seu envolvimento na função reforçadora de estímulos naturais ou drogas é a via dopaminérgica que se projeta da área ventral tegmental (VTA) para as áreas desse circuito (Kalivas, Churchill, & Klitenick, 1993; Koob & Le Moal, 2001, entre outros). Schultz e sua equipe, por exemplo, vêm mostrando que a apresentação de estímulos filogeneticamente importantes para o organismo (USs), como por exemplo alimento, ocasiona aumento no disparo das células dopaminérgicas dessa via, e que após a associação repetida de um estímulo neutro com um estímulo filogeneticamente importante, como acontece no condicionamento respondente, o aumento de atividade dos neurônios passa a ser eliciado pelo estímulo inicialmente neutro (CS). Em processos operantes, estímulos que indicam o aumento da probabilidade de reforço também eliciam aumento de disparos de neurônios dopaminérgicos mesencefálicos após treino. Ainda, esses neurônios respondem diferencialmente a CSs associados a diferentes probabilidades de apresentação do US (Apicella, Ljungberg, Scarnati, & Schultz, 1991; Schultz, 1997, 1998; Schultz, Apicella, Scarnati, & Ljungberg, 1992; Schultz, Tremblay, & Hollerman, 2003).

As mudanças no padrão de disparo dos neurônios dopaminérgicos, descritas por Schultz e colaboradores são coerentes com a idéia de que os neurônios dopaminérgicos do Nac recebem aferências do córtex e de outras regiões. Para que a associação entre um US e um CS (ou entre um S^D, uma resposta motora e um S^R) seja aprendida, o sinal dopaminérgico do Nac e do estriado dorsal precisa interagir com a neurotransmissão das projeções provenientes do córtex, hipocampo e amígdala e com as projeções eferentes das áreas envolvidas com movimento, como por exemplo o pálio ventral (Carelli, 2002). Por exemplo, sabe-se que as projeções do VTA para a concha do Nac e para a amígdala basolateral e central têm papel fundamental na modulação da saliência motivacional de estímulos (isto é, na eficácia reforçadora ou eliciadora) e na aprendizagem de associação entre estímulos neutros e USs.

Por outro lado, comportamentos mais complexos, como escolha, parecem depender não apenas de vias dopaminérgicas, mas também de vias glutamatérgicas e da interação entre elas. Assim, existem dados que mostram que as interconexões, tanto dopaminérgicas como glutamatérgicas, entre o cerne do Nac e o CPF modulam a emissão e intensidade das respostas adaptativas aprendidas, quando na presença de estímulos que predizem eventos motivacionalmente relevantes (Kelley, 2004). O que é mais, a atividade dos neurônios no Nac eliciada por estímulos condicionados é específica ao estímulo incondicionado com o qual foi associado (Carelli & Wondolowski, 2003).

Bases neurais da dependência como escolha

Existe uma vasta literatura que mostra que drogas que agem como reforçadores produzem mudanças no circuito do reforço por processos similares aos dos reforçadores primários típicos (comida, água, sexo, por exemplo). No entanto, as mudanças produzidas pelas drogas parecem ser mais fortes e permanentes do que as causadas pela maioria desses estímulos. As drogas de abuso possuem características peculiares que fazem delas reforçadores altamente poderosos, e como resultado, estímulos a elas pareados são rápida e fortemente associados aos seus efeitos. Por exemplo, as conseqüências das drogas sobre o sistema nervoso são mais imediatas que as da maioria dos reforçadores típicos (Heyman, 1996), afetam populações de neurônios de DA no Nac diferentes dos reforçadores típicos (Carelli, 2002), e a atividade dos neurônios dopaminérgicos é mais acentuada sob ação dessas drogas em comparação a outros reforçadores (Hyman & Malenka, 2001).

Segundo Kalivas e colaboradores, as drogas de abuso, especialmente os psicoestimulantes, produziriam desregulação no funcionamento do circuito do reforço por diminuir a excitabilidade intrínseca dos neurônios espinhosos do Nac. Essa neuroadaptação aumenta as respostas eliciadas por estímulos ambientais associados às drogas e diminui as respostas eliciadas por outros estímulos naturais, tendo como resultado final aumento dos comportamentos de procura e auto-administração de droga, mesmo quando estes possam produzir conseqüências aversivas importantes na vida do sujeito.

Três estágios no desenvolvimento da dependência são distinguidos por Kalivas e Volkow (2005). Em cada um desses estágios acontecem alterações moleculares e morfológicas das células do Nac e do CPF. No primeiro estágio, referido aos efeitos agudos da droga, são produzidas alterações transitórias na expressão gênica de algumas proteínas das células dopaminérgicas do circuito da motivação, como por exemplo os genes de reposta imediata (IEG) c-fos e c-jun, (para uma revisão ver Torres & Horowitz, 1999). Essas mudanças podem perdurar algumas horas ou até alguns dias e, ainda que medeiem a repetida auto-administração de drogas, não estão diretamente associadas às alterações comportamentais de longo prazo observadas no dependente.

No segundo estágio, chamado de “transição à dependência”, as mudanças moleculares são produto da administração repetida da droga ou de seu uso intermitente. Nesse estágio se produz super-regulação da via AMPc e aumento na expressão da proteína ∆FosB (uma forma truncada do FosB sem 101 aminoácidos C-terminais). Esse aumento nos níveis de ∆FosB se dá gradualmente, o que sugere mudanças de longo prazo na regulação da expressão gênica da célula (Chao & Nestler, 2004). Essas mudanças parecem estar associadas com aumento da subunidade GluR1 dos receptores AMPA glutamatérgicos e alterações na neurotransmissão no Nac, que são importantes para a transição à dependência.

No estagio final da dependência, o terceiro e ultimo estágio, são observadas alterações permanentes de neurotransmissão entre o CPF e o Nac, como também na neutrotransmissão pré-sináptica e pós-sináptica do Nac. No CPF se produz aumento da proteína G por ativação da proteina AGS3. Esse aumento tem conseqüências importantes na neurotransmissão dopaminérgica, pois essa ativação da proteína G inibe os receptores D2, aumentando com isso o sinal dos receptores D1 e a excitabilidade dos neurônios piramidais que se projetam do CPF ao Nac. Para entender a importância dessa mudança é necessário explicar a função da dopamina na neurotransmissão do CPF.

A regulação pela dopamina da neurotransmissão glutamatérgica no CPF depende do tipo de receptor dopaminérgico que é preferencialmente estimulado (Seamans & Yang, 2004). Um tipo de regulação, chamado de estado 1, é mediado pelo receptor dopaminérgico D₂ e se caracteriza pela diminuição de inibição sináptica. Essa inibição permite o acesso de várias entradas excitatórias que depois são projetadas do CPF para o Nac. Um segundo tipo de regulação, o estado 2, é mediado pelo receptor D₁ e se caracteriza por um aumento da inibição sináptica, de forma tal que apenas estimulações (inputs) particularmente fortes no CPF sejam transmitidas para o Nac. Dessa forma, no estado 1 o comportamento é função da concorrência entre as diferentes estimulações produzidas por vários estímulos. Porém, no estado 2 o comportamento é função das poucas estimulações suficientemente fortes.

Segundo Kalivas et al. (2005), quando um dependente está em abstinência a regulação dopaminérgica no CPF é mediada pelo receptor D₁ (estado 2), o que causa que apenas estímulos ambientais associados repetidamente com o efeito da droga sejam capazes de ativar a neurotransmissão entre o CPF e Nac. Como conseqüência disso, estímulos não associados à droga perdem controle sobre o comportamento, isto é, diminuem seu valor eliciador ou reforçador condicionado. Em contrapartida, produz-se aumento do controle dos estímulos associados à droga. Comportamentalmente isso é observado por aumento excessivo de comportamentos associados à obtenção e consumo da droga (drug-seeking).

Em paralelo às alterações no sinal projetado pelo CPF, a transmissão glutamatérgica no Nac encontra-se potenciada. Nos terminais pré-sinápticos do Nac do dependente a liberação de glutamato está aumentada devido à diminuição da regulação inibitória pré-sináptica e ao aumento da capacidade de liberação das vesículas. Nos terminais pós-sinápticos, por outro lado, existe diminuição de proteínas, como Homer e PSD-95, que causam alterações morfológicas da célula e interferem com a regulação pós-sináptica do excesso de glutamato. Ambas essas alterações aumentam o sinal excitatório produzido pelos estímulos associados à droga e restringem os mecanismos que naturalmente regulam o sinal glutamatérgico (Kalivas et al., 2005).

Estudos com seres humanos dependentes apóiam o processo acima descrito. Em períodos de abstinência, dependentes de cocaína mostram atividade basal no CPF reduzida, assim como diminuição da atividade dopaminérgica e diminuição de receptores D₂ nessa área (Garavan et al., 2000). Também nesses sujeitos, a apresentação de estímulos associados à droga mostra-se temporalmente correlacionada com aumento de atividade do CPF e do nível fissura auto-relatado. Ainda mais, quando estímulos reforçadores naturais lhes são apresentados, como estímulos sexuais, é observada uma ativação do CPF significativamente menor do que aquela produzida pelos estímulos associados à droga e do que a observada em sujeitos não dependentes (Garavan et al., 2000).

Em resumo, Kalivas e colaboradores (Kalivas & Hu, 2006; Kalivas et al., 2005; Kalivas & Volkow, 2005) sugerem que a dependência é produto de mudanças de longo prazo na regulação das vias glutamatérgicas do circuito do reforço, especificamente das localizadas no CPF e Nac. Essas mudanças alteram os processos de escolha e tomada de decisões no dependente, resultando que estímulos associados ao efeito da droga adquirem maior controle sobre o comportamento do que estímulos associados a outros reforçadores.

A idéia da dependência como um problema de escolha, em que a droga adquiriria maior controle sobre o comportamento do que os outros reforçadores, por estes perderem valor reforçador, foi originalmente proposta por Heyman (1996)¹⁰. Os trabalhos de Kalivas e colaboradores (Kalivas & Hu, 2006; Kalivas et al., 2005; Kalivas & Volkow, 2005) aumentam a compreensão desse processo, acrescentando a descrição das mudanças neurofisiológicas que o explicam. Por outro lado, esses autores integram a teoria de Heyman (1996) com a proposta de Robinson e Berridge (1993, 2001, 2003), evidenciando que o aumento do controle dos estímulos associados à droga (isto é, a sensibilização do incentivo) é parte fundamental do processo de dependência e está intimamente ligado aos comportamentos “compulsivos” de procura e consumo de droga observados no dependente. Outro aporte dos trabalhos de Kalivas e colaboradores para a compreensão da dependência é mostrar que a integração de princípios comportamentais com achados da neurociência permite explicar o processo de dependência em termos dos estímulos de que é função, os efeitos da droga e os estímulos associados a esses efeitos. Isso ratifica o apontado repetidamente neste trabalho: termos imprecisos como “querer” ou “gostar” são desnecessários para a compreensão da dependência.

Conclusão

Os avanços recentes das neurociências integrados às teorias comportamentais vêm mudando a visão do fenômeno de dependência. O que antes era considerado doença ou falta de vontade, hoje é entendido como alteração no controle de estímulos antecedentes e conseqüentes sobre o comportamento de escolha, decorrente de mudanças específicas no sistema nervoso central. Essa perspectiva promete o desenvolvimento de tecnologia comportamental e farmacêutica mais precisa para o tratamento da dependência de drogas.

Referências

Apicella, P., Ljungberg, T., Scarnati, E., & Schultz, W. (1991). Responses to reward in monkey dorsal and ventral striatum. Experimental Brain Research, 85(3), 491-500. [ Links ]

Baum, W. M. (1974). Choice in free-ranging wild pigeons. Science, 185, 78-79. [ Links ]

Carelli, R. M. (2002). Nucleus accumbens cell firing during goal-directed behaviors for cocaine vs. ‘natural' reinforcement. Physiology and Behavior, 76(3), 379-387.

Carelli, R. M., & Wondolowski, J. (2003). Selective encoding of cocaine versus natural rewards by nucleus accumbens neurons is not related to chronic drug exposure. Journal of Neuroscience, 23(35), 11214-11223. [ Links ]

Chao, J., & Nestler, E. J. (2004). Molecular neurobiology of drug addiction. Annual Review of Medicine, 55, 113-132. [ Links ]

Ciccocioppo, R., Martin-Fardon, R., & Weiss, F. (2004). Stimuli associated with a single cocaine experience elicit long-lasting cocaine-seeking. Nature Neuroscience, 7(5), 495-496. [ Links ]

Colwill, R. M., & Rescorla, R. A. (1985). Post-conditioning devaluation of a reinforcer affects instrumental responding. Journal of Experimental Psychology: Animal Behavior Processes, 11, 120-132. [ Links ]

de Villiers, P. A. (1983). Elección de los programas concurrentes y una formulación cuantitativa de la ley del efecto. In W. K. Honig & J. E. R. Staddon (Eds.), Manual de conducta operante (pp. 314-385). Mexico: Trillas. [ Links ]

de Villiers, P. A., & Herrnstein, R. J. (1976). Toward a law of response strength. Psychological Bulletin, 83(6), 1131-1153. [ Links ]

Donahoe, J. W., & Burgos, J. E. (2000). Behavior analysis and revaluation. Journal of Experimental Analysis of Behavior, 74(3), 331-346. [ Links ]

Donahoe, J. W., & Palmer, D. C. (1994). Learning and complex behavior. Boston: Allyn and Bacon. [ Links ]

Garavan, H., Pankiewicz, J., Bloom, A., Cho, J. K., Sperry, L., Ross, T. J. et al. (2000). Cue-induced cocaine craving: Neuroanatomical specificity for drug users and drug stimuli. American Journal of Psychiatry, 157(11), 1789-1798. [ Links ]

Gawin, F. H., & Khalsa-Denison, M. E. (1996). Is craving mood-driven or self-propelled? Sensitization and “street” stimulant addiction. Nida Research Monograph, 163, 224-250.

Herrnstein, R. J. (1961). Relative and absolute strenght of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267-272. [ Links ]

Herrnstein, R. J., & Prelec, D. (1992). A theory of addiction. In G. Loewenstein & J. Elster (Eds.), Choice over time (pp. 331-360). New York: Russell Sage Press. [ Links ]

Herrnstein, R. J., & Vaughan, W. (1980). Melioration and behavioral allocation. In J. E. R. Staddon (Ed.), Limits to action: The allocation of individual behavior (pp. 143-176). New York.: Academic Press. [ Links ]

Heyman, G. M. (1996). Resolving the contradictions of addiction. Behavioral and Brain Sciences, 19(4), 561-610. [ Links ]

Hyman, S. E. (1995). What is addiction? Harvard Medical Alumni Bulletin, 68, 29-33. [ Links ]

Hyman, S. E., & Malenka, R. C. (2001). Addiction and the brain: The neurobiology of compulsion and its persistence. Nature Review of Neuroscience, 2(10), 695-703. [ Links ]

Kalivas, P. W., Churchill, L., & Klitenick, M. A. (1993). The circuitry mediating the translation of motivational stimuli into adaptative motor response. In P. W. Kalivas & C. D. Barnes (Eds.), Limbic motor circuits and neuropsychiatry (pp. 237-287). Boca Raton: CRC Press. [ Links ]

Kalivas, P. W., & Hu, X. T. (2006). Exciting inhibition in psychostimulant addiction. Trends in Neurosciences, 29(11), 610-616. [ Links ]

Kalivas, P. W., & Nakamura, M. (1999). Neural systems for behavioral activation and reward. Current Opinion in Neurobiology, 9, 223-227. [ Links ]

Kalivas, P. W., & Volkow, N. D. (2005). The neural basis of addiction: A pathology of motivation and choice. Current Opinion in Neurobiology, 162(8), 1403-1413. [ Links ]

Kalivas, P. W., Volkow, N., & Seamans, J. (2005). Unmanageable motivation in addiction: A pathology in prefrontal-accumbens glutamate transmission. Neuron, 45(5), 647-650. [ Links ]

Kelley, A. E. (2004). Ventral striatal control of appetitive motivation: Role in ingestive behavior and reward-related learning. Neuroscience and Biobehavioral Reviews, 27(8), 765-776. [ Links ]

Koob, G. F., & Le Moal, M. (2001). Drug addiction, dysregulation of reward, and allostasis. Neuropsychopharmacology, 24(2), 97-129. [ Links ]

Leshner, A. L. (1997). Addiction is a brain disease, and it matters. Science, 278(3), 45-47. [ Links ]

McDowell, J. J. (1988). Matching theory in natural human environments. The Behavior Analyst, 11(2), 95-109. [ Links ]

McKim, W. A. (2004). Drugs and behavior: An introduction to behavioral pharmacology (4th ed.). New Jersey: Prentice Hall. [ Links ]

Melzack, R. (1990). The tragedy of needless pain. Scientific American, 262(2), 27-33. [ Links ]

Rachlin, H. (1976). Behavior and learning. San Francisco, CA: W.H. Freeman and Company. [ Links ]

Rachlin, H. (1997). Introduction to modern behaviorism. New York: W. H. Freeman and Company. [ Links ]

Rescorla, R. A. (1985). Associationism in animal learning. In L. G. Nilsson & T. Archer (Eds.), Perspectives in learning and memory (pp. 39-61). New Jersey: Erlbaum. [ Links ]

Rescorla, R. A. (1988). Pavlovian conditioning: Its not what you think it is. American Psychologist, 43, 151-160. [ Links ]

Robinson, T. E., & Berridge, K. C. (1993). The neural basis of drug craving: An incentive-sensitization theory of addiction. Brain Research Reviews, 18(3), 247-291. [ Links ]

Robinson, T. E., & Berridge, K. C. (2001). Incentive-sensitization and addiction. Addiction, 96(1), 103-114. [ Links ]

Robinson, T. E., & Berridge, K. C. (2003). Addiction. Annual Review of Psychology, 54, 25-53. [ Links ]

Schuckit, M. A. (1994). Low level of response to alcohol as a predictor of future alcoholism. American Journal of Psychiatry, 151(184-189). [ Links ]

Schultz, W. (1997). Dopamine neurons and their role in reward mechanisms. Current Opinion in Neurobiology, 7(2), 191-197. [ Links ]

Schultz, W. (1998). Predictive reward signal of dopamine neurons. Journal of Neurophysiology, 80(1), 1-27. [ Links ]

Schultz, W., Apicella, P., Scarnati, E., & Ljungberg, T. (1992). Neuronal activity in monkey ventral striatum related to the expectation of reward. Journal of Neuroscience, 12(12), 4595-4610. [ Links ]

Schultz, W., Tremblay, L., & Hollerman, J. R. (2003). Changes in behavior-related neuronal activity in the striatum during learning. Trends in Neuroscience, 26(6), 321-328. [ Links ]

Seamans, J. K., & Yang, C. R. (2004). The principal features and mechanisms of dopamine modulation in the prefrontal cortex. Progress in Neurobiology, 74(1), 1-58. [ Links ]

Silva, M. T. A., Guerra, L. G. G. C., Gonçalves, F. L., & Garcia-Mijares, M. (2001). Análise funcional da dependência de drogas. In H. J. Ghilardi, M. B. B. P. Madi, P. P. Queiroz & M. C. Scoz (Eds.), Sobre comportamento e cognição (pp. 422-442). Santo André, SP: ESEtec. [ Links ]

Skinner, B. F. (1953). Science and human behavior. New York: MacMillan. [ Links ]

Skinner, B. F. (1966). Phylogeny and ontogeny of behavior. Science, 153, 1205-1213. [ Links ]

Solomon, R. L., & Corbit, J. D. (1974). An opponent-process theory of motivation. I. Temporal dynamics of affect. Psychological Review, 81(2), 119-145. [ Links ]

Torres, G., & Horowitz, J. M. (1999). Drugs of abuse and brain gene expression. Psychosomatic Medicine, 61(5), 630-645. [ Links ]

Wise, R. A., & Bozarth, M. A. (1987). A psychomotor stimulant theory of addiction. Psychological Review, 94, 469-492. [ Links ]

Wyvell, C. L., & Berridge, K. C. (2001). Incentive sensitization by previous amphetamine exposure: Increased cue-triggered “wanting” for sucrose reward. Journal of Neuroscience, 21(19), 7831-7840.

Recebido em: 17/12/2006
Aceito em: 21/12/2006

¹ Artigo originado da tese de doutoramento da primeira autora defendida em 2005 no Instituto de Psicologia - USP. Apoio financeiro da FAPESP e CNPq.
² Pós-Doutoranda do Departamento de Psicologia Experimental do Instituto de Psicologia - USP. Endereço eletrônico: mgarciam@usp.br
³ Docente do Departamento de Psicologia Experimental do Instituto de Psicologia - USP. Endereço eletrônico: teresar@usp.br
⁴ Outras teorias de dependência, como a “teoria dos processos opostos” de Solomon e Corbit (1974), a teoria da “desregulação homeostática do prazer” de Koob e Le Moal (2001) e a teoria “estimulante psicomotora” de Wise e Bozarth (1987), não serão abordadas neste trabalho, por terem se mostrado limitadas na sua explicação da dependência. Contudo, a existência de tantas teorias mostra a dificuldade da demarcação das variáveis e mecanismos que determinam a dependência. Aliás, essa dificuldade é apenas reflexo da diversidade epistemológica que existe dentro da psicologia e da suas explicações do comportamento.
⁵ Dentro dessa teoria o termo “incentivo” seria equivalente ao CS.
⁶ O termo “saliência” faz referência ao grau de controle de um estímulo sobre o comportamento.
⁷ O termo “representação” é usado no sentido cognitivista.
⁸ O termo “revalorização” (revaluation) foi introduzido por Donahoe e Burgos (2000) como substituição do termo usado tradicionalmente de “desvalorização” (devaluation). O termo “desvalorização” era usado porque os primeiros experimentos sobre esse fenômeno usavam CS de natureza aversiva, o que causava diminuição da resposta operante. Sabe-se agora que, se o pareamento é realizado com CS positivos, o efeito é de aumentar a resposta operante.Assim, o termo revalorização abarca ambos os procedimentos em que associações CS-US alteram respostas operantes.
⁹ Donahoe e Burgos (2000) criticam as interpretações de Rescorla (1985) e de outros associacionistas por serem inferências de processos (associações) que não podem ser medidos e testados. Como contrapartida, propõem uma explicação biocomportamental do fenômeno.
¹⁰ É importante apontar que ainda que Heyman (1996) já tivesse proposto e desenvolvido essa idéia, não existe referência a sua proposta nos trabalhos de Kalivas e colaboradores (Kalivas & Hu, 2006; Kalivas et al., 2005; Kalivas & Volkow, 2005). Isso possivelmente indica a falta de comunicação que ainda existe entre as áreas comportamentais e da neurociência.