Machine Learning Engineer ( NLP)
Nuclia ha creado una API que simplifica el complejo proceso de crear un motor de búsqueda impulsado por IA sobre cualquier dato no estructurado, en cualquier formato e idioma, sin importar dónde esté almacenado. Puede gestionar la transcripción de vídeo y audio, la extracción de contenido de imágenes, y el análisis sintáctico de documentos.😮
Les estamos ayudando con la búsqueda de un/a machine Learning engineer que afronte el reto de aportar valor a un equipo de lo más top. 🌟
¿Quieres formar parte de un equipo que transformará la forma en que los seres humanos encuentran información? 👇👀👇
¿Qué harás?
Primero, un poco de contexto: 🗒
En España, hay muchas empresas que se dedican a integrar tecnología, pero lo que hace a Núclia realmente única… Es que ¡están construyendo tecnología! Compitiendo directamente con startups de nivel mundial, desde Londres a Silicon Valley. 🌪️
Nuclia ha desarrollado una API capaz de conectarse a los distintos repositorios de información no estructurada de una organización, siendo capaz de indexar el conocimiento y, mediante GenAI, de responder a preguntas sobre los datos no estructurados de la empresa.
Ofrecen una solución 100% end-to-end. Dónde sea que esté la información, y sin importar el formato e idioma, NucliaDB es capaz de indexarla y almacenarla. ¡Anda! Que ¿qué es NucliaDB? NucliaDB es la base de datos multi-modal, de vectores, y open source que ha desarrollado la compañía. Ya solo eso es impresionante, pero, lo vas a ver, este equipo no se conforma con cualquier cosa. En Nuclia también permiten la integración con los distintos LLMs existentes en el mercado, ¡y hasta ofrecen su propio modelo de lenguaje!
El producto de Nuclia es una API pensada como una búsqueda asistida por Inteligencia Artificial. Uno de sus puntos fuertes es que gestionan todo el ciclo, de tal forma que un/ usuario/a tiene sus datos privados sobre los cuales quiere mejorar su búsqueda. Este usuario/a puede subir toda la información sobre la cual quiere buscar, Nuclia procesa la información desde el punto de vista de datos no estructurados, con cualquier tipo de fichero, y de ahí se hace un procesamiento que intenta sacar el máximo de texto e información 🤖 . Entra en juego entonces la parte Open Source de Nuclia, que es NucliaDB, Esto les permite buscar semánticamente, entre en el contenido del usuario. 👀
Las funcionalidades de generación de respuestas en Nuclia se basan en el concepto RAG, Retrieval-Augmented Generation, con el que una vez se ha localizado dónde, en los datos del usuario, se halla la respuesta a lo que se pregunta, y se genera una respuesta al más puro estilo ChatGTP o BARD. En este sentido, han integrado varios generadores de lenguaje y ahora están generando el suyo propio, para poder personalizar la experiencia de búsqueda del usuario. 🦾
La parte final consiste en que el usuario va a ser capaz de etiquetar, y entrenar sus propios modelos para cerrar todo el círculo.
También hacen control de “alucinaciones”, para asegurar que lo que se produce viene de los datos del usuario, garantizando que los datos del usuario no salen a ninguna API externa.
Como usuario, más que entrenar tus propios modelos, puedes tunearlos, para que se vuelvan más específicos y aprendan de manera más focalizada.🎓 De esta forma, el modelo que llega al cliente es mucho más potente, sin que le requiera demasiado esfuerzo.
🍫 Pero vamos al turrón, ¿qué harás tú? 🫵
¡Prepárate para un viaje al futuro con el equipo NUA! 🚀
Te unirás a NUA, Nuclia Understanding API, que fusiona dos conjuntos: Imagina fusionar el poder de la ingeniería de software y la magia del machine learning en un solo equipo.💻✨ Uno que combina ingeniería de software con un poco de plataforma, y otro especializado en machine learning, enfocado en todo lo relacionado con inteligencia artificial. En este equipo, estarás en contacto con asuntos relacionados con el procesamiento natural del lenguaje y el machine learning. A diferencia de centrarse únicamente en investigación, su enfoque radica en llevar a producción las innovaciones desarrolladas en LLM, garantizando su continuidad y mantenimiento. ¡Nada de quedarse en la teoría! 🚀🧠
Tienen dos APIs, una es la que procesa archivos y saca información de ellos, y otra que hace inferencia sobre los modelos de machine learning y su entrenamiento. También se hacen cargo del sistema de autorización de toda la plataforma, y de otros sistemas necesarios, como por ejemplo, el de usuarios y cuentas, así como recoger los datos necesarios para poder cobrar por uso a los clientes.
🚨DISCLAIMER🚨 Si piensas que Transformer es una película o el juguete de moda para estas Navidades, esta oferta no es para ti 😅
Trabajarás con un equipo de desarrolladores, ingenieros ML y científicos de datos, para poner en producción soluciones ML y NLP de vanguardia.
Como Machine Learning Engineer en su equipo, serás “the hero” detrás de las cortinas, construyendo y mejorando sus plataformas con el poder del procesamiento del lenguaje natural y el aprendizaje automático. 🤖💻
Tu misión: construir plataformas, sistemas e infraestructuras que sean tan fuertes como un castillo. Utilizarás tu experiencia en Procesamiento del Lenguaje Natural y aprendizaje automático para que sus sistemas sean tan inteligentes como el mago más sabio. 🏰🧠
Serás el/la malabarista maestro/a de proyectos, plazos y entregables. Manejarás las prioridades con tu destreza técnica, asegurándote de que cada proyecto brille como una estrella en el cielo de la tecnología. 🌟🤹♂️
¡Diseñarás, desarrollarás, probarás, desplegarás, mantendrás y mejorarás soluciones de software como un/a arquitecto/a de soluciones brillantes detrás de las escenas, construyendo el futuro con líneas de código! 🏗️💡
Tomarás la iniciativa como un verdadero/a héroe/ heroína, enfrentándote a los retos de procesados de datos y flujo de trabajo como si fueran dragones que necesitas vencer. ¡Tus soluciones técnicas serán tu espada y escudo! 🐉🛡️
¡También vas a solucionar problemas en producción y cazar bugs!
Como ya te habrás dado cuenta 😁 , que vengas con un fuerte background técnico como Software Engineer será vital, ya necesitarás esa base para tu trabajo como ML y NLP
¡Si te unes a este equipo, cada línea de código contará una historia de innovación y éxito! 🎉👩💻
En Nuclia hay un nivel muy alto de conocimiento, son apasionados, proactivos y con muchísimo ownership, capaces de crear, desarrollar, probar y vigilar que funcione y, esperan que la persona que se incorpore aporte valor del mismo modo.
Contarás con un equipo de Plataforma, que se encargará de proveer todos los recursos necesarios para mantener tu autonomía. Están dedicados a facilitar la monitorización en producción, el desarrollo diario con sistemas automatizados y la implementación en diversas zonas. La integración y despliegues continuados se lleva a cabo mediante GitHub Actions + ArgoCD
Tienen su infraestructura en GCP y AWS, despliegan de forma automatizada en todos los sitios.
Por si fuese poco, han creado su propia base de datos, que escala horizontalmente para el diseño del producto en sí mismo.
Usan event sourcing para el escalado, con NATS como backend. Esto les permite escalar a nivel de tráfico y a nivel de consultas. Desarrollarás en tu día a día con FastApi, el framework rest python elegido para desarrollar todas las APIs en Nuclia
Es importante que tengas experiencia profesional con Kubernetes, ya que todo lo que vas a tocar está montado sobre ello.
Se valora que tengas una base programando software utilizando patrones asíncronos, si conoces Asyncio, mejor que mejor, es lo que utilizarás para estos casos, luego es algo que con ellos podrás desarrollar. 🎓
Tu evolución
En 1 mes
Durante el primer mes habrás completado tu onboarding, conocerás a todo el equipo, y los diferentes departamentos que componen la empresa.
Tendrás una primera visión de todas las piezas del puzzle de Nuclia: que hace y cómo lo hace. Dentro de las tareas que tengan sobre la mesa cuando entres, intentarán empezar con tareas/funcionalidades que partan de cero (o casi) para poder acostumbrarte gradualmente, no solo al código, sino también a todas las tecnologías, jerga y herramientas.
Habrás avistado, cazado y eliminado algún bug, y probablemente ya entiendas qué quiere decir "stashify" 👴. También es más que probable que hayas ayudado al equipo en algún que otro "asunto" en producción para calentar.
Tus responsabilidades
Construirás sus plataformas, sistemas e infraestructuras utilizando tu experiencia en procesamiento del lenguaje natural y aprendizaje automático.
Gestionarás las prioridades individuales de los proyectos, los plazos y los entregables con tu experiencia técnica.
Participarás activamente en diseñar, desarrollarás, probar, desplegar, mantener y mejorar soluciones de software.
Tomar la iniciativa y ser responsable de las soluciones técnicas a los retos de calidad de datos y flujo de trabajo.
Ser responsable de definir y elaborar métricas de calidad y escalado para nuestros componentes
Mantendrás a raya cualquier Bug que pueda aparecer
Llevar a producción componentes avanzados como pipelines de finetuneado de LLM
¿Cómo lo harás?
La flexibilidad es su segundo nombre! 🚀 En Nuclia, no se casan con ninguna metodología. Se adaptan más rápido que un camaleón en una pista de baile. 💃
¿Cómo se organizan?
Con sprints bisemanales porque, sinceramente, ¡les gusta mantenerse en forma! 🏃♂️💨 En sus sprints planning, todo el equipo se reúne para planificar las iteraciones. Priorizan, hacen malabares con tareas y dejan claro qué queda pendiente. ¡Es un espectáculo de planificación en vivo! 🎪
No podrían empezar el día sin su dosis diaria de 15 minutos de stand-up daily. 🌞 Y para mantenerse sincronizados en toda la empresa, se juntan cada semana en el Weekly planning. ¡Es como una fiesta semanal de sincronización! 🎉
¿Cuál es su superpoder? La escalabilidad. Hacen magia para que su plataforma crezca más rápido que un meme viral. En el equipo rotan según la funcionalidad en la que trabajen y, una vez a la semana, hacen una reunión para asegurarse de que todo esté en marcha. 🎠
Objetivo: 👉 que todo esté muy estable. 🦾
¡Y para sumarle un toque internacional a la mezcla, tendrás la oportunidad de practicar tu "english pitinglish" con colegas de EE. UU. y Francia! 🌍🗣️
Cada trimestre, cada equipo se marca objetivos y, de vez en cuando, quedan en encuentros presenciales para celebrar como campeones/as. El Roadmap es tan transparente que podrías verlo con gafas de sol. 🕶️ Y, claro, todo en el equipo está en la onda. 🤝
¿Suena emocionante? ¡Únete al equipo donde la planificación es un arte y la estabilidad es su mantra! 🚀🌈
¿Cuándo trabajarás?
Trabaja cuando te sientas más productivo/a. ¡No más mirar el reloj! 🕰️
Tienen una jornada flexible de lunes a viernes 100% remoto, confían en el sentido común y creen en construir un ambiente de trabajo colaborativo y amigable. ¡Son un equipo, después de todo! 🤝
Quieren a alguien con el gen del "ownership", alguien que no solo haga su trabajo, sino que también se sienta dueño/a de él. ¡Hazlo a tu manera! 🛠️🎉
Vacaciones
22 díasJornada laboral
Flexible¿Dónde trabajarás?
Remoto
¡Desde donde quieras!
Esta posición es 100% remota, por lo que mientras te asegures que tienes buena conexión, podrás trabajar desde tu casa del pueblo o la playa del Sardinero 🏖️.
Suelen reunirse semestralmente para realizar actividades de teambuilding. Este año, por ejemplo, quedaron en mayo y octubre.
Van a priorizar a personas que residan en España, si vives en Europa y la diferencia horaria no es mayor a dos horas, escríbenos igualmente y hablamos.
¿Con quién trabajarás?
Ahora mismo son 26 personas en Nuclia. En el equipo de NUA que es donde tú estarás ahora mismo, hay 3 compañeros/as te les presentamos:
Carles Bruguera Artero: Software Engineer. Con más de 15 años de experiencia en el mundo de software, experto en python, siempre está deseando aprender nuevas tecnologías, y le gusta crear cosas útiles que simplifiquen y ayuden en la vida cotidiana. Como líder del equipo de Software siempre encontrarás en él, la ayuda que necesites para seguir creciendo. 🤜🤛
Carmen Iniesta López: NLP Machine Learning Engineer . Murciana que cree en valores como feminismo, justicia algorítmica, lingüística y datos para el bien social. Diversidad e igualdad en la tecnología para ganar. ¡Y ojo! Es la que más sabe de ML, de hecho será tu líder en este apasionante viaje 💪
Albert Nadal Garriga: Software Engineer. Le apasiona trabajar en proyectos desafiantes y creativos que requieren aprender nuevas habilidades y utilizar tecnologías de código abierto. Tiene un canal de YouTube donde publica el código fuente de sus proyectos paralelos y otras utilidades.🎙
¿Qué piden?
Quieren a alguien, que haya visto Transformers… nos referimos al modelo Transformer y no a Optimus Prime. Aunque hay que admitir que siempre hay que estar listo para 'transformar' problemas de código en soluciones épicas, ¡sin necesidad de llamar a los Autobots! 😉
En su «lista de los Reyes Magos» 👑👑👑 nos han pedido a un/a Machine Learning Engineer, que tenga fuerte background técnico como Software Engineer.
Por eso consideran muy importante que traigas en tu mochila 🎒:
- Experiencia en desarrollo de software en Python (al menos 4 años), idealmente 3 de ellos con NLP.
- Estar al día de los últimos modelos de ML y que cuentes con gran interés en poner en producción soluciones innovadoras. Ah... recuerda que ellos han creado el suyo propio 🤔.
- Experiencia en uno o más de los siguientes campos: PLN, tecnologías de búsqueda, recuperación de información, ML, Transformers, Keras, MLOps, Tensorflow.
- Que hayas procesado datos de fuentes no estructuradas.
- Inglés fluido, tanto verbal como escrito. Ya que están en plena expansión a EE. UU. y tendrás compañeros que no hablan castellano.💂
Si vas a por el 🔟 valoran:
- Que cuentes con formación en Ingeniería informática o similar
- Bagaje en el uso, diseño e implementación de APIs REST.
- Experiencia depurando, perfilando y optimizando código python.
- Que te hayas pegado profesionalmente con: arquitectura/desarrollo de sistemas distribuidos a gran escala, concurrencia, multihilo y sincronización.
- Que hayas trabajado ya con las APIs de los LLMs privados más conocidos (palm, cohere, openai, anthropic… )
- Si has trabajado en entornos Unix/Linux, ¡mejor que mejor!
- Comprensión de tecnologías como Kubernetes, GitOps, CI/CD.
- Que entiendas sobre programación en red, y de tecnologías como NATS Jetstream o Kafka.
- Que sepas y te guste, lo que es trabajar en un entorno de startup.🛸
Y ya sería un regalo extra 🎁 si además traes experiencia:
- Entrenando o finetuneando LLMs
- En prompt engineering
- En la creación de software utilizando patrones asíncronos, darán palmas con las orejas, si la tienes con Asyncio.👏
- Bagaje liderando proyectos de código abierto.
- Escribiendo aplicaciones de alto rendimiento.
Tecnologías
Innegociable
Fastapi
TensorFlow
Estaría bien
Kubernetes
Suma puntos
Pytest
Otras habilidades
Innegociable
Adaptabilidad al cambio
Proactividad
Atención al detalle
Comunicación verbal
Capacidad de autogestión
Capacidad de abstracción
Estaría bien
Inteligencia emocional
Capacidad de dar feedback
Capacidad de recibir feedback
Idiomas
¿Qué ofrecen?
📡 Trabajo remoto 100%
💰 50€ bruto/mensual por gastos TT
🕓 Horario flexible
💻 Equipo necesario para que puedas trabajar Facilitan portátil MBP y si necesitas algo adicional como (teclado, monitor, ratón) la empresa lo compra.
🍲 Posibilidad de recibir retribución Flexible (Ticket, Guarde, Rest y Transporte).
What the FAQ?
Se están centrando en contratar personas que residan en España (por motivos administrativos) o Europa, cuya diferencia horaria no sea mayor a dos horas y que puedan acudir a la oficina al menos dos veces al año.
Consta de 5 fases, pero somos muy ágiles:
☝️ Entrevista de encaje técnico con Hiring Manager Técnico
✌️ Code Testing
👌 Revisión de la prueba técnica con Hiring Manager Técnico
🖖 Entrevista final con Ramón y Eudald (Founders)
🏆 Entrevista de bienvenida y cultural con Alejandra.
NO. Tienen algún miembro del equipo trabajando desde Francia, con eso te decimos todo.
Alguna vez organizan algún encuentro presencial semestral (teambuildings), pero ir es 100% opcional y todo coste asociado correrá por cuenta de Nuclia.
Trimestralmente, el equipo de NUA propone una reunión presencial, o coincidiendo con el final del Q, para seguir haciendo piña🍍 y definir los objetivos juntos.
Y todo el equipo se junta 2 veces al año ( este año en octubre y mayo) para realizar actividades de taembuilding.