Glossary OS

Lectura rápida

Empieza por la explicación más corta y útil antes de profundizar.

A class of LLMs trained with reinforcement learning to generate step-by-step internal chain-of-thought before producing a final answer, enabling stronger performance on complex math, coding, and logic tasks. Pioneered by OpenAI's o1 (September 2024) and followed by o3, DeepSeek-R1, and Claude's extended thinking mode. Unlike standard LLMs that answer directly, reasoning models produce a variable-length internal CoT, allowing controllable compute at inference time.

Modelo mental

Usa primero la analogía corta para razonar mejor sobre el término cuando aparezca en código, docs o prompts.

Piensa en esto como una pieza de la pila de contexto o inferencia usada en productos con agentes o LLMs.

Contexto técnico

Ubica el término dentro de la capa de Solana en la que vive para razonar mejor sobre él.

LLMs, RAG, embeddings, inferencia y primitivas orientadas a agentes.

Por qué le importa a un builder

Convierte el término de vocabulario en algo operacional para producto e ingeniería.

Este término desbloquea conceptos adyacentes rápido, así que funciona mejor cuando lo tratas como un punto de conexión y no como una definición aislada.

Handoff para IA

Usa este bloque compacto cuando quieras dar contexto sólido a un agente o asistente sin volcar toda la página.

Reasoning Model (reasoning-model)
Categoría: IA / ML
Definición: A class of LLMs trained with reinforcement learning to generate step-by-step internal chain-of-thought before producing a final answer, enabling stronger performance on complex math, coding, and logic tasks. Pioneered by OpenAI's o1 (September 2024) and followed by o3, DeepSeek-R1, and Claude's extended thinking mode. Unlike standard LLMs that answer directly, reasoning models produce a variable-length internal CoT, allowing controllable compute at inference time.
Aliases: Thinking Model, o1, o3
Relacionados: Chain-of-Thought (CoT), LLM (Modelo de Lenguaje Grande), Inference

Glossary Copilot

Haz preguntas de Solana con contexto aterrizado sin salir del glosario.

Usa contexto del glosario, relaciones entre términos, modelos mentales y builder paths para recibir respuestas estructuradas en vez de output genérico.

Abrir workspace completa del Copilot

Pregunta

Explicar este código

Opcional: pega código Anchor, Solana o Rust para que el Copilot mapee primitivas de vuelta al glosario.

Haz una pregunta aterrizada en el glosario

El Copilot responderá usando el término actual, conceptos relacionados, modelos mentales y el grafo alrededor del glosario.

Grafo conceptual

Ve el término como parte de una red, no como una definición aislada.

Estas ramas muestran qué conceptos toca este término directamente y qué existe una capa más allá de ellos.

Rama

Chain-of-Thought (CoT)

A prompting technique or model-native capability where the LLM produces intermediate reasoning steps before arriving at a final answer, improving accuracy on multi-step problems. Originally a prompting strategy ('think step by step'), CoT is now built directly into reasoning models like o1 and DeepSeek-R1 as an internal process. When combining CoT with structured output, developers should place reasoning fields before answer fields to avoid bypassing the reasoning process.

Reasoning Model

Lectura rápida

Modelo mental

Contexto técnico

Por qué le importa a un builder

Handoff para IA

Haz preguntas de Solana con contexto aterrizado sin salir del glosario.

Haz una pregunta aterrizada en el glosario

Ve el término como parte de una red, no como una definición aislada.

Chain-of-Thought (CoT)

LLM (Modelo de Lenguaje Grande)

Inference

Mantén la cadena de aprendizaje en movimiento en lugar de parar en una sola definición.

Chain-of-Thought (CoT)

LLM (Modelo de Lenguaje Grande)

Inference

RLHF (Reinforcement Learning from Human Feedback)

Términos cercanos en vocabulario, acrónimo o vecindad conceptual.

Diffusion Model

Foundation Model

State Space Model (Mamba)

Sigue los conceptos que realmente le dan contexto a este término.

Chain-of-Thought (CoT)

LLM (Modelo de Lenguaje Grande)

Inference

Quédate en la misma capa y sigue construyendo contexto.

LLM (Modelo de Lenguaje Grande)

Transformer

Attention Mechanism

Foundation Model