Glossary OS

Leitura rápida

Comece pela explicação mais curta e útil antes de aprofundar.

A class of LLMs trained with reinforcement learning to generate step-by-step internal chain-of-thought before producing a final answer, enabling stronger performance on complex math, coding, and logic tasks. Pioneered by OpenAI's o1 (September 2024) and followed by o3, DeepSeek-R1, and Claude's extended thinking mode. Unlike standard LLMs that answer directly, reasoning models produce a variable-length internal CoT, allowing controllable compute at inference time.

Modelo mental

Use primeiro a analogia curta para raciocinar melhor sobre o termo quando ele aparecer em código, docs ou prompts.

Pense nisso como uma peça da pilha de contexto ou inferência usada em produtos com agentes ou LLMs.

Contexto técnico

Coloque o termo dentro da camada de Solana em que ele vive para raciocinar melhor sobre ele.

LLMs, RAG, embeddings, inferência e primitivas voltadas a agentes.

Por que builders ligam para isso

Transforme o termo de vocabulário em algo operacional para produto e engenharia.

Este termo destrava conceitos adjacentes rapidamente, então funciona melhor quando você o trata como um ponto de conexão, não como definição isolada.

Handoff para IA

Use este bloco compacto quando quiser dar contexto aterrado para um agente ou assistente sem despejar a página inteira.

Reasoning Model (reasoning-model)
Categoria: IA / ML
Definição: A class of LLMs trained with reinforcement learning to generate step-by-step internal chain-of-thought before producing a final answer, enabling stronger performance on complex math, coding, and logic tasks. Pioneered by OpenAI's o1 (September 2024) and followed by o3, DeepSeek-R1, and Claude's extended thinking mode. Unlike standard LLMs that answer directly, reasoning models produce a variable-length internal CoT, allowing controllable compute at inference time.
Aliases: Thinking Model, o1, o3
Relacionados: Chain-of-Thought (CoT), LLM (Modelo de Linguagem Grande), Inference

Glossary Copilot

Faça perguntas de Solana com contexto aterrado sem sair do glossário.

Use contexto do glossário, relações entre termos, modelos mentais e builder paths para receber respostas estruturadas em vez de output genérico.

Abrir workspace completa do Copilot

Pergunta

Explicar este código

Opcional: cole código Anchor, Solana ou Rust para o Copilot mapear primitivas de volta para termos do glossário.

Faça uma pergunta aterrada no glossário

O Copilot vai responder usando o termo atual, conceitos relacionados, modelos mentais e o grafo ao redor do glossário.

Grafo conceitual

Veja o termo como parte de uma rede, não como uma definição sem saída.

Esses ramos mostram quais conceitos esse termo toca diretamente e o que existe uma camada além deles.

Ramo

Chain-of-Thought (CoT)

A prompting technique or model-native capability where the LLM produces intermediate reasoning steps before arriving at a final answer, improving accuracy on multi-step problems. Originally a prompting strategy ('think step by step'), CoT is now built directly into reasoning models like o1 and DeepSeek-R1 as an internal process. When combining CoT with structured output, developers should place reasoning fields before answer fields to avoid bypassing the reasoning process.

Reasoning Model

Leitura rápida

Modelo mental

Contexto técnico

Por que builders ligam para isso

Handoff para IA

Faça perguntas de Solana com contexto aterrado sem sair do glossário.

Faça uma pergunta aterrada no glossário

Veja o termo como parte de uma rede, não como uma definição sem saída.

Chain-of-Thought (CoT)

LLM (Modelo de Linguagem Grande)

Inference

Continue a cadeia de aprendizado em vez de parar em uma única definição.

Chain-of-Thought (CoT)

LLM (Modelo de Linguagem Grande)

Inference

RLHF (Reinforcement Learning from Human Feedback)

Termos próximos em vocabulário, sigla ou vizinhança conceitual.

Diffusion Model

Foundation Model

State Space Model (Mamba)

Siga os conceitos que realmente dão contexto a este termo.

Chain-of-Thought (CoT)

LLM (Modelo de Linguagem Grande)

Inference

Permaneça na mesma camada e continue construindo contexto.

LLM (Modelo de Linguagem Grande)

Transformer

Attention Mechanism

Foundation Model