ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

The Fort Worth Press - ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

Fort Worth 26°C

USD -

AED 3.672499

AFN 63.49745

ALL 82.633029

AMD 367.81347

ANG 1.790403

AOA 916.999952

ARS 1461.505699

AUD 1.441639

AWG 1.8

AZN 1.715562

BAM 1.715644

BBD 2.014246

BDT 122.861805

BGN 1.69088

BHD 0.3772

BIF 2987.24539

BMD 1

BND 1.295549

BOB 6.92556

BRL 5.173098

BSD 1.000105

BTN 94.687626

BWP 13.599361

BYN 2.808821

BYR 19600

BZD 2.011333

CAD 1.418805

CDF 2264.999622

CHF 0.80976

CLF 0.023111

CLP 909.649786

CNY 6.7748

CNH 6.78915

COP 3441.24

CRC 453.69217

CUC 1

CUP 26.5

CVE 96.725381

CZK 21.24805

DJF 178.090844

DKK 6.561625

DOP 58.536115

DZD 133.598219

EGP 49.725799

ERN 15

ETB 161.234408

EUR 0.87784

FJD 2.24285

FKP 0.754878

GBP 0.75675

GEL 2.645014

GGP 0.754878

GHS 11.225636

GIP 0.754878

GMD 72.999986

GNF 8763.311637

GTQ 7.629858

GYD 209.231741

HKD 7.84001

HNL 26.757135

HRK 6.615901

HTG 130.75668

HUF 311.258997

IDR 17921

ILS 2.996975

IMP 0.754878

INR 94.746197

IQD 1310.110704

IRR 1374999.999746

ISK 126.289781

JEP 0.754878

JMD 157.423814

JOD 0.708981

JPY 161.541504

KES 129.449525

KGS 87.450353

KHR 4014.105511

KMF 430.999706

KPW 900.00035

KRW 1536.210323

KWD 0.30902

KYD 0.833436

KZT 486.473447

LAK 22146.685497

LBP 89557.448376

LKR 334.602361

LRD 182.011965

LSL 16.491476

LTL 2.95274

LVL 0.60489

LYD 6.417656

MAD 9.360252

MDL 17.606449

MGA 4178.106825

MKD 54.12869

MMK 2099.387374

MNT 3579.000015

MOP 8.07637

MRU 39.722981

MUR 47.960227

MVR 15.460471

MWK 1734.153231

MXN 17.485902

MYR 4.140497

MZN 63.899865

NAD 16.491476

NGN 1368.395506

NIO 36.798891

NOK 9.7818

NPR 151.500026

NZD 1.761385

OMR 0.384502

PAB 1.000105

PEN 3.385323

PGK 4.386042

PHP 61.243499

PKR 278.148213

PLN 3.759275

PYG 6096.517967

QAR 3.645646

RON 4.606095

RSD 103.033017

RUB 74.553283

RWF 1466.604677

SAR 3.754291

SBD 8.065041

SCR 14.05647

SDG 600.500902

SEK 9.70755

SGD 1.295885

SHP 0.746601

SLE 24.749695

SLL 20969.503664

SOS 571.588975

SRD 37.4305

STD 20697.981008

STN 21.491605

SVC 8.751031

SYP 110.532098

SZL 16.486254

THB 33.201501

TJS 9.275777

TMT 3.51

TND 2.960315

TOP 2.40776

TRY 46.47955

TTD 6.79047

TWD 31.661499

TZS 2625.232026

UAH 44.892717

UGX 3660.590537

UYU 40.114211

UZS 12015.842175

VES 616.865275

VND 26325

VUV 118.758526

WST 2.756325

XAF 575.410972

XAG 0.016117

XAU 0.000243

XCD 2.70255

XCG 1.8024

XDR 0.713895

XOF 575.410972

XPF 104.61587

YER 238.649784

ZAR 16.483897

ZMK 9001.192558

ZMW 17.940666

ZWL 321.999592

ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

ECONOMIA 06.06.2024

Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.

Tamanho do texto:

Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.

Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).

O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.

Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.

Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?

Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?

A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.

As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.

Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.

- "Não tenho muita certeza" -

Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".

"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.

A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.

Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".

Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.

Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.

Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.

De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.

B.Martinez--TFWP

The Fort Worth Press - ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

Apresentou

Bolsas mundiais operam em queda impactadas pelo setor de tecnologia

Brexit completa 10 anos entre dúvidas da população britânica

Bolsas na Ásia e Europa operam em queda impactadas pelo setor de tecnologia

Ex-presidente do Fed Alan Greenspan morre aos 100 anos