¿Son los tokens visuales más efectivos que los tokens de texto para las tareas lingüísticas?
Está en las noticias: tenemos un nuevo momento DeepSeek. Quizás un poco menos sofisticado, pero un gran avance que podría redefinir los LLM. En su artículo más reciente, la ballena presenta DeepSeek-OCR, un nuevo y potente modelo de OCR (Reconocimiento Óptico de Caracteres). Si bien sus capacidades de OCR son impresionantes, la verdadera intriga para nosotros…










