Ingenier - Helion

ebook

Autor: Chip Huyen
ISBN: 9781098180195
stron: 534, Format: ebook
Data wydania: 2025-11-13
Księgarnia: Helion

Cena książki: 211,65 zł (poprzednio: 267,91 zł)
Oszczędzasz: 21% (-56,26 zł)

Osoby, które kupiły tę książkę, wybierały także »

Tagi: Sztuczna inteligencja

Los recientes avances en IA no sólo han aumentado la demanda de productos de IA, sino que también han reducido las barreras de entrada para quienes quieren crear productos de IA. El enfoque del modelo como servicio ha transformado la IA de una disciplina esotérica en una potente herramienta de desarrollo que cualquiera puede utilizar. Todo el mundo, incluidos los que tienen una experiencia mínima o nula en IA, puede ahora aprovechar los modelos de IA para crear aplicaciones. En este libro, el autor Chip Huyen habla de la ingeniería de la IA: el proceso de creación de aplicaciones con modelos básicos fácilmente disponibles.

El libro comienza con una visión general de la ingeniería de IA, explicando en qué se diferencia de la ingeniería de ML tradicional y hablando de la nueva pila de IA. Cuanto más se utiliza la IA, más oportunidades hay de que se produzcan fallos catastróficos, y por tanto, más importante se vuelve la evaluación. En este libro se analizan distintos enfoques para evaluar modelos abiertos, incluido el enfoque de la IA como juez, que está creciendo rápidamente.

Los desarrolladores de aplicaciones de IA descubrirán cómo navegar por el panorama de la IA, incluidos los modelos, los conjuntos de datos, los puntos de referencia de evaluación y el número aparentemente infinito de casos de uso y patrones de aplicación. Aprenderás un marco para desarrollar una aplicación de IA, empezando con técnicas sencillas y avanzando hacia métodos más sofisticados, y descubrirás cómo desplegar eficazmente estas aplicaciones.

Comprenderás qué es la ingeniería de la IA y en qué se diferencia de la ingeniería tradicional del aprendizaje automático
Aprenderás el proceso para desarrollar una aplicación de IA, los retos en cada paso y los enfoques para abordarlos
Explorar diversas técnicas de adaptación de modelos, como la ingeniería de impulsos, la GAR, el ajuste fino, los agentes y la ingeniería de conjuntos de datos, y comprender cómo y por qué funcionan.
Examinar los cuellos de botella de la latencia y el coste al servir modelos de base y aprender a superarlos
Elige el modelo, el conjunto de datos, las referencias de evaluación y las métricas adecuados a tus necesidades

Chip Huyen trabaja para acelerar el análisis de datos en GPU en Voltron Data. Anteriormente, trabajó en Snorkel AI y NVIDIA, fundó una startup de infraestructura de IA y enseñó Diseño de Sistemas de Aprendizaje Automático en Stanford. Es autora del libro Designing Machine Learning Systems, un superventas de Amazon en IA.

AI Engineering se basa en Designing Machine Learning Systems (O'Reilly) y lo complementa.

Osoby które kupowały "Ingenier", wybierały także:

Produkty oparte na sztucznej inteligencji. Projektowanie, budowa i rozwijanie rozwi 77,00 zł, (40,04 zł -48%)
Prompt engineering. Projektowanie aplikacji z wykorzystaniem LLM 89,00 zł, (46,28 zł -48%)
Stw 99,00 zł, (51,48 zł -48%)
Tworzenie aplikacji AI z LlamaIndex. Praktyczny przewodnik po RAG i LLM 89,00 zł, (46,28 zł -48%)
Zaawansowane techniki przetwarzania j 89,00 zł, (46,28 zł -48%)

Spis treści

Ingeniería de IA (Spanish Edition). Creación de aplicaciones con modelos básicos eBook -- spis treści

Prefacio
- De qué trata este libro
- Lo que no es este libro
- A quién va dirigido este libro
- Cómo explorar este libro
- Convenciones utilizadas en este libro
- Uso de ejemplos de código
- Capacitación en línea de OReilly
- Cómo contactarnos
- Agradecimientos
1. Introducción a la creación de aplicaciones de IA con modelos fundacionales
- El auge de la ingeniería de IA
  - De los modelos lingüísticos a los grandes modelos lingüísticos
    - Modelos lingüísticos
    - Autosupervisión
  - De los grandes modelos lingüísticos a los modelos fundacionales
  - De los modelos fundacionales a la ingeniería de IA
- Casos de uso de modelos fundacionales
  - Codificación
  - Producción de imagen y vídeo
  - Redacción
  - Educación
  - Bots conversacionales
  - Agregación de información
  - Organización de datos
  - Automatización del flujo de trabajo
- Planificación de aplicaciones de IA
  - Evaluación de casos de uso
    - El papel de la IA y los humanos en la aplicación
    - Defensibilidad de los productos de IA
  - Establecimiento de expectativas
  - Planificación de hitos
  - Mantenimiento
- La pila de ingeniería de IA
  - Las tres capas de la pila de IA
  - Ingeniería de IA Vs. ingeniería de ML
    - Desarrollo de modelos
      - Modelado y entrenamiento
      - Ingeniería de conjuntos de datos
      - Optimización de la inferencia
    - Desarrollo de aplicaciones
      - Evaluación
      - Ingeniería de prompts y construcción de contextos
      - Interfaz de la IA
  - Ingeniería de IA Vs. ingeniería de pila completa
- Resumen
2. Comprender los modelos fundacionales
- Datos de entrenamiento
  - Modelos multilingües
  - Modelos específicos de dominio
- Modelado
  - Arquitectura de modelos
    - Arquitectura de transformador
      - Mecanismo de atención
      - Bloque transformador
    - Otras arquitecturas de modelos
  - Tamao del modelo
    - Ley de escalado: Construir modelos de computación optimizada
    - Extrapolación de escalas
    - Cuellos de botella de escalado
- Post-entrenamiento
  - Afinado supervisado
  - Afinado de preferencias
    - Modelo de recompensa
    - Afinado mediante el modelo de recompensa
- Muestreo
  - Fundamentos de muestreo
  - Estrategias de muestreo
    - Temperatura
    - Top-k
    - Top-p
    - Condición de parada
  - Cómputo de tiempo de prueba
  - Outputs estructurados
    - Prompting
    - Post-procesamiento
    - Muestreo restringido
    - Afinado
  - La naturaleza probabilística de la IA
    - Incoherencia
    - Alucinación
- Resumen
3. Metodología de evaluación
- Retos de la evaluación de los modelos fundacionales
- Comprender las métricas de modelado lingüístico
  - Entropía
  - Entropía cruzada
  - Bits por carácter y bits por byte
  - Perplejidad
  - Interpretación y casos prácticos de la perplejidad
- Evaluación exacta
  - Corrección funcional
  - Medidas de similitud con los datos de referencia
    - Coincidencia exacta
    - Similitud léxica
    - Similitud semántica
  - Introducción a la incrustación
- La IA como juez
  - Por qué la IA como juez?
  - Cómo utilizar la IA como juez
  - Limitaciones de la IA como juez
    - Incoherencia
    - Ambigüedad de los criterios
    - Mayores costos y latencia
    - Sesgos de la IA como juez
  - Qué modelos pueden actuar como jueces?
- Ranking de modelos con evaluación comparativa
  - Retos de la evaluación comparativa
    - Cuellos de botella en la escalabilidad
    - Falta de normalización y control de calidad
    - Del rendimiento comparativo al rendimiento absoluto
  - El futuro de la evaluación comparativa
- Resumen
4. Evaluar los sistemas de IA
- Criterios de evaluación
  - Capacidades específicas de dominio
  - Capacidad de generación
    - Coherencia factual
    - Seguridad
  - Capacidad de seguimiento de instrucciones
    - Criterios de seguimiento de instrucciones
    - Juego de rol
  - Costo y latencia
- Selección de modelos
  - Flujo de trabajo de selección de modelos
  - Construir un modelo vs. comprar un modelo
    - Código abierto, ponderación abierta y licencias modelo
    - Modelos de código abierto frente a API de modelos
      - Privacidad de datos
      - Linaje de datos y derechos de autor
      - Rendimiento
      - Funcionalidad
      - Costo de API vs. costo de ingeniería
      - Control, acceso y transparencia
      - Implementación en el dispositivo
  - Explorar las pruebas comparativas públicas
    - Selección e integración de pruebas comparativas
      - Tableros de clasificación públicos
      - Tableros de clasificación personalizadas con pruebas comparativas públicas
    - Contaminación de datos con pruebas comparativas públicas
      - Cómo se produce la contaminación de datos
      - Manejo de la contaminación de datos
- Disear su proceso de evaluación
  - Paso 1. Evaluar todos los componentes de un sistema
  - Paso 2. Crear una directriz de evaluación
    - Definir los criterios de evaluación
    - Crear rúbricas de puntuación con ejemplos
    - Vincular las métricas de evaluación a las métricas de negocio
  - Paso 3. Definir los métodos y datos de evaluación
    - Seleccionar métodos de evaluación
    - Anotar los datos de evaluación
    - Evalúe su proceso de evaluación
    - Iterar
- Resumen
5. Ingeniería de prompts
- Introducción al prompting
  - Aprendizaje en contexto: Cero shot y pocos shots
  - Prompt de sistema y prompt de usuario
  - Longitud y eficacia del contexto
- Mejores prácticas de ingeniería de prompts
  - Escribir instrucciones claras y explícitas
    - Explique, sin ambigüedades, lo que quiere que haga el modelo.
    - Pida al modelo que adopte una personalidad
    - Dé ejemplos
    - Especifique el formato de output
  - Aportar suficiente contexto
  - Dividir tareas complejas en subtareas más sencillas
  - Dar tiempo al modelo para pensar
  - Hacer iteraciones de prompts
  - Evaluar las herramientas de ingeniería de prompts
  - Organizar y versionar prompts
- Ingeniería de prompts defensiva
  - Prompts patentados e ingeniería inversa de prompts
  - Jailbreaking e inyección de prompts
    - Hackeo de prompts manual directo
    - Ataques automatizados
    - Inyección indirecta de prompts
  - Extracción de información
  - Defensas contra los ataques de prompts
    - Defensa a nivel de modelo
    - Defensa a nivel de prompt
    - Defensa a nivel de sistema
- Resumen
6. RAG y agentes
- RAG
  - Arquitectura RAG
  - Algoritmos de recuperación
    - Recuperación basada en términos
    - Recuperación basada en incrustaciones
    - Comparación de algoritmos de recuperación
    - Combinar los algoritmos de recuperación
  - Optimización de la recuperación
    - Estrategia de fragmentación
    - Reranking
    - Reescritura de consultas
    - Recuperación contextual
  - RAG más allá de los textos
    - RAG multimodal
    - RAG con datos tabulares
- Agentes
  - Visión general de los agentes
  - Herramientas
    - Aumento de conocimientos
    - Extensión de capacidades
    - Acciones de escritura
  - Planificación
    - Visión general de la planificación
    - Modelos fundacionales como planificadores
    - Generación de planes
      - Llamada a funciones
      - Granularidad de la planificación
      - Planes complejos
    - Reflexión y corrección de errores
    - Selección de herramientas
  - Modos de fallo y evaluación de los agentes
    - Fallos de planificación
    - Fallos de las herramientas
    - Eficiencia
- Memoria
- Resumen
7. Afinado
- Visión general del afinado
- Cuándo hacer un afinado
  - Razones para hacer un afinado
  - Razones para no hacer un afinado
  - Afinado y RAG
- Cuellos de botella en la memoria
  - Retropropagación y parámetros entrenables
  - Matemática de la memoria
    - Memoria necesaria para la inferencia
    - Memoria necesaria para el entrenamiento
  - Representaciones numéricas
  - Cuantización
    - Cuantización de inferencia
    - Cuantización del entrenamiento
- Técnicas de afinado
  - Afinado eficiente en parámetros
    - Técnicas PEFT
    - LoRA
      - Por qué funciona LoRA?
      - Configuraciones LoRA
      - Servir adaptadores LoRA
      - LoRA cuantizado
  - Fusión de modelos y afinado multitarea
    - Suma
      - Combinación lineal
      - Interpolación lineal esférica (SLERP)
      - Poda de parámetros redundantes específicos de la tarea
    - Apilamiento de capas
    - Concatenación
  - Tácticas de afinado
    - Afinado de marcos y modelos base
      - Modelos base
      - Métodos de afinado
      - Marcos de afinado
    - Afinado de hiperparámetros
      - Tasa de aprendizaje
      - Tamao de lote
      - Número de épocas
      - Ponderación de pérdida de prompts
- Resumen
8. Ingeniería de conjuntos de datos
- Curación de datos
  - Calidad de datos
  - Cobertura de datos
  - Cantidad de datos
  - Adquisición y anotación de datos
- Aumento y síntesis de datos
  - Por qué la síntesis de datos
  - Técnicas tradicionales de síntesis de datos
    - Síntesis de datos basada en reglas
    - Simulación
  - Síntesis de datos con IA
    - Síntesis de datos de instrucción
    - Verificación de datos
    - Limitaciones de los datos generados por IA
      - Control de calidad
      - Imitación superficial
      - Colapso potencial del modelo
      - Linaje de datos oscuro
  - Destilación de modelos
- Procesamiento de datos
  - Inspeccionar los datos
  - Deduplicar datos
  - Limpiar y filtrar datos
  - Dar formato a los datos
- Resumen
9. Optimización de la inferencia
- Comprender la optimización de la inferencia
  - Visión general de la inferencia
    - Cuellos de botella de cómputo
    - API de inferencia en línea y por lotes
  - Métricas de rendimiento de la inferencia
    - Latencia, TTFT y TPOT
    - Throughput (productividad) y goodput (productividad útil)
    - Utilización, MFU y MBU
  - Aceleradores de IA
    - Qué es un acelerador?
    - Capacidad de cómputo
    - Tamao y ancho de banda de la memoria
    - Consumo de energía
- Optimización de la inferencia
  - Optimización de modelos
    - Compresión del modelo
    - Superar el cuello de botella de la decodificación autorregresiva
      - Decodificación especulativa
      - Inferencia con referencia
      - Decodificación paralela
    - Optimización del mecanismo de atención
      - Redisear el mecanismo de atención
      - Optimización del tamao de la caché KV
      - Escribir kernels para el cálculo de la atención
    - Kernels y compiladores
  - Optimización del servicio de inferencia
    - Agrupación por lotes
    - Desacoplamiento del llenado previo y la decodificación
    - Almacenamiento en cache de prompts
    - Paralelismo
- Resumen
10. Arquitectura de ingeniería de IA y retroalimentación de los usuarios
- Arquitectura de ingeniería de IA
  - Paso 1. Mejorar el contexto
  - Paso 2. Instalar barreras de seguridad
    - Barreras de seguridad de input
    - Barreras de seguridad de output
    - Implementación de barreras de seguridad
  - Paso 3. Aadir enrutador de modelos y puerta de enlace
    - Enrutador
    - Puerta de enlace
  - Paso 4. Reducir la latencia con cachés
    - Almacenamiento exacto en caché
    - Almacenamiento semántico en caché
  - Paso 5. Aadir patrones de agente
  - Monitoreo y observabilidad
    - Métricas
    - Registros y rastros
    - Detección de deriva
  - Orquestación de procesos de IA
- Retroalimentación de los usuarios
  - Extracción de retroalimentación conversacional
    - Retroalimentación en lenguaje natural
      - Finalización anticipada
      - Corrección de errores
      - Quejas
      - Sentimiento
    - Otra retroalimentación conversacional
      - Regeneración
      - Organización de la conversación
      - Duración de la conversación
      - Diversidad en el diálogo
  - Diseo de la retroalimentación
    - Cuándo recabar retroalimentación
      - Al principio
      - Cuando pasa algo malo
      - Cuando el modelo tiene poca confianza
    - Cómo recabar retroalimentación
  - Limitaciones de la retroalimentación
    - Sesgos
    - Bucle de retroalimentación degenerado
  - Resumen
índice