Nuclia
Equipo Nunclia
Nuclia
Oferta cerrada el 09/02/2024

NLP Research Engineer

Salario60-70K
Remoto100%
🌎 Remoto 100% en España/Europa🛸 Startup🎯 Producto🤖 IAOpen-source ⚡💂 Inglés

Nuclia ha creado una API que simplifica el complejo proceso de crear un motor de búsqueda impulsado por IA sobre cualquier dato no estructurado, en cualquier formato e idioma, sin importar dónde esté almacenado. Puede gestionar la transcripción de vídeo y audio, la extracción de contenido de imágenes, y el análisis sintáctico de documentos.😮

Les estamos ayudando con la búsqueda de un/a NLP Research Engineer que afronte el reto de aportar valor a un equipo de lo más top. 🌟

¿Quieres formar parte de un equipo que transformará la forma en que los seres humanos encuentran información? 👇👀👇

¿Qué harás?

Primero, un poco de contexto: 🗒

En España, hay muchas empresas que se dedican a integrar tecnología, pero lo que hace a Núclia realmente única… Es que ¡están construyendo tecnología! Compitiendo directamente con startups de nivel mundial, desde Londres a Silicon Valley.  🌪️

Nuclia ha desarrollado una API capaz de conectarse a los distintos repositorios de información no estructurada de una organización, siendo capaz de indexar el conocimiento y, mediante GenAI, de responder a preguntas sobre los datos no estructurados de la empresa.

Ofrecen una solución 100% end-to-end. Dónde sea que esté la información, y sin importar el formato e idioma, NucliaDB es capaz de indexarla y almacenarla. ¡Anda! Que ¿qué es NucliaDB? NucliaDB es la base de datos multi-modal, de vectores, y open source que ha desarrollado la compañía. Ya solo eso es impresionante, pero, lo vas a ver, este equipo no se conforma con cualquier cosa. En Nuclia también permiten la integración con los distintos LLMs existentes en el mercado, ¡y hasta ofrecen su propio modelo de lenguaje!

El producto de Nuclia es una API pensada como una búsqueda asistida por Inteligencia Artificial. Uno de sus puntos fuertes es que gestionan todo el ciclo, de tal forma que un/a usuario/a tiene sus datos privados sobre los cuales quiere mejorar su búsqueda. Este usuario/a puede subir toda la información sobre la cual quiere buscar, Nuclia procesa la información desde el punto de vista de datos no estructurados, con cualquier tipo de fichero, y de ahí se hace un procesamiento que intenta sacar el máximo de texto e información 🤖 . Entra en juego, entonces, la parte Open Source de Nuclia, que es NucliaDB. Esto les permite buscar semánticamente, entre en el contenido del usuario. 👀

Las funcionalidades de generación de respuestas en Nuclia se basan en el concepto RAG, Retrieval-Augmented Generation, con el que una vez se ha localizado dónde, en los datos del usuario, se halla la respuesta a lo que se pregunta, y se genera una respuesta al más puro estilo ChatGTP o BARD. En este sentido, han integrado varios generadores de lenguaje y ahora están generando el suyo propio, para poder personalizar la experiencia de búsqueda del usuario. 🦾

La parte final consiste en que el usuario va a ser capaz de etiquetar, y entrenar sus propios modelos para cerrar todo el círculo. 

También hacen control de “alucinaciones”, para asegurar que lo que se produce viene de los datos del usuario, garantizando que los datos del usuario no salen a ninguna API externa. 


Como usuario, más que entrenar tus propios modelos, puedes tunearlos, para que se vuelvan más específicos y aprendan de manera más focalizada.🎓 De esta forma, el modelo que llega al cliente es mucho más potente, sin que le requiera demasiado esfuerzo.

             Pero vamos al turrón, ¿qué harás tú? 🫵

¡Prepárate para un viaje al futuro con el equipo LLMs! 🚀

Imagina que estás a punto de embarcarte en una aventura fascinante en el mundo del Procesamiento del Lenguaje Natural (NLP). ¡Aquí está tu hoja de ruta emocionante! 🚀

Tus funciones serán tan awesómicas como prototipar, diseñar e integrar soluciones increíbles en las plataformas de Nuclia. No es solo eso; estarás utilizando tecnologías de vanguardia en procesamiento del lenguaje natural y aprendizaje automático. 🛠️💬

Tu misión principal será gestionar las prioridades de proyectos, plazos y entregables. No te preocupes, tu experiencia técnica será tu varita mágica para llevar a cabo esta gestión de manera impecable.

Pero espera, ¡hay más! Harás magia a la hora de tomar la iniciativa y liderar las soluciones técnicas ante los desafíos de calidad de datos y flujo de trabajo. Imagínate resolviendo problemas y marcando la pauta con nuevas propuestas brillantes. 💡👩‍💻

En este equipo, la pasión por la investigación es palpable. Están siempre al tanto de los modelos más recientes, y si en tres semanas surge el modelo disruptivo del momento a nivel internacional, ¡se lanzan de cabeza! Les encanta experimentar, aprender y probar como verdaderos científicos. 🤓🔬

Conocen todos los modelos y requisitos para utilizarlos. Resolver problemas de NLP es su especialidad. También comparan tecnologías y definen soluciones especializadas que potencian su producto. 🤖📊

En el ámbito de tecnologías, trabajarás con Python, PyTorch, Kubernetes, NLP, Hugging Face, Datasets.

Son super fan de state of the art librerie, desarrolladas por la comunidad científica y la industria para facilitar la implementación de técnicas y modelos de procesamiento del lenguaje natural más avanzados. 🚀💡

Tu evolución

Nuclia
Tu primer día

En 1 mes

Durante el primer mes habrás completado tu onboarding, conocerás a todo el equipo, y los diferentes departamentos que componen la empresa.

Tendrás una primera visión de todas las piezas del puzzle de Nuclia: qué hace y cómo lo hace. Dentro de las tareas que tengan sobre la mesa cuando entres, intentarán empezar con tareas/funcionalidades que partan de cero (o casi) para poder acostumbrarte gradualmente, no solo al código, sino también a todas las tecnologías, jerga y herramientas. 

También es más que probable que hayas ayudado al equipo en algún que otro "asunto" en producción para calentar.

Tus responsabilidades

  • Prototipar, diseñar e integrar soluciones en sus plataformas, utilizando tecnologías punteras de procesamiento del lenguaje natural y aprendizaje automático.

  • Gestionar las prioridades individuales de los proyectos, los plazos y los entregables

  • Tomar la iniciativa y ser responsable de las soluciones técnicas de los retos de calidad de datos y flujo de trabajo.

¿Cómo lo harás?

La flexibilidad es su segundo nombre! 🚀 En Nuclia, no se casan con ninguna metodología. Se adaptan más rápido que un camaleón en una pista de baile. 💃

¿Cómo se organizan?

 Con sprints bisemanales porque, sinceramente, ¡les gusta mantenerse en forma! 🏃‍♂️💨 En sus sprints planning, todo el equipo se reúne para planificar las iteraciones. Priorizan, hacen malabares con tareas y dejan claro qué queda pendiente. ¡Es un espectáculo de planificación en vivo! 🎪

No podrían empezar el día sin su dosis diaria de 15 minutos de stand-up daily. 🌞 Y para mantenerse sincronizados en toda la empresa, se juntan cada semana en el Weekly planning. ¡Es como una fiesta semanal de sincronización! 🎉

¿Cuál es su superpoder? La escalabilidad. Hacen magia para que su plataforma crezca más rápido que un meme viral. En el equipo rotan según la funcionalidad en la que trabajen y, una vez a la semana, hacen una reunión para asegurarse de que todo esté en marcha. 🎠

Objetivo: 👉 que todo esté muy estable. 🦾

¡Y para sumarle un toque internacional a la mezcla, tendrás la oportunidad de practicar tu "english pitinglish" con colegas de EE. UU. y Francia! 🌍🗣️

Cada trimestre, cada equipo se marca objetivos y, de vez en cuando, quedan en encuentros presenciales para celebrar como campeones/as. El Roadmap es tan transparente que podrías verlo hasta con gafas de sol. 🕶️ Y, claro, todo en el equipo está en la onda. 🤝

¿Cuándo trabajarás?

Trabaja cuando te sientas más productivo/a. ¡No más mirar el reloj! 🕰️

Tienen una jornada flexible de lunes a viernes 100% remoto, confían en el sentido común y creen en construir un ambiente de trabajo colaborativo y amigable. ¡Son un equipo, después de todo! 🤝

Quieren a alguien con el gen del "ownership", alguien que no solo haga su trabajo, sino que también se sienta dueño/a de él. ¡Hazlo a tu manera! 🛠️🎉

Día laborable

Jornada completa

Vacaciones

22 días

Jornada laboral

Flexible

¿Dónde trabajarás?

Remoto

100%

¡Desde donde quieras!

Esta posición es 100% remota,  por lo que mientras te asegures que tienes buena conexión, podrás trabajar desde tu casa del pueblo o la playa del Sardinero 🏖️.

Suelen reunirse semestralmente para realizar actividades de teambuilding.  Este año, por ejemplo, quedaron en mayo y octubre. 

Van a priorizar a personas que residan en España, si vives en Europa y la diferencia horaria no es mayor a dos horas, escríbenos igualmente y hablamos.

¿Con quién trabajarás?

Ahora mismo son 26 personas en Nuclia. En el equipo de LLMs que es donde tú estarás ahora mismo, hay 3 compañeros/as te les presentamos: 

Francisco Jose Morón Reyes (ML Engineer). Empezó su carrera como Data Scientist en diferentes empresas de software hasta asentarse en Nuclia. Su formación abarca diferentes y muy variados ámbitos del conocimiento, desde humanidades hasta ingeniería de software. Disfruta de aprender todo tipo de nuevos conocimientos para aplicarlos a todo lo que se mueve. ¡Listo para cualquier desafío en este emocionante viaje! 💼✨

Aleix Ruiz de Villa Robert Es consultor de ciencia de datos especializado en inferencia casual, con experiencia como Head of Data Science. Con un gran interés en la ciencia de datos, que lo mismo trabaja en proyectos de predicción de churn, como series temporales, como que te escribe un libro "Causal Inference for Data Science", o te organiza un evento. ¡No para!! ¡¡Y es que se organiza tan bien que tiene tiempo para todo!!  🕰️💪

Ramón Navarro Bosch (Cofundador y CTO). Él llegó cuando todo era campo. Y se embarcó en la ventura de diseñar el producto de Nuclia. Tiene muchos sombreros: Gestor de proyectos, desarrollador de software informático, desarrollador de sistemas linux embebidos, gestor de redes y sistemas… Está especialmente interesado en el mundo del software libre. Podrás contar siempre con su conocimiento y amabilidad para conocer TODO de Nuclia. Por algo es el que más sabe. ⭐🎓

¿Qué piden?

Quieren a alguien, que haya visto Transformers… nos referimos al modelo Transformer y no a Optimus Prime. Aunque hay que admitir que siempre hay que estar listo para 'transformar' problemas de código en soluciones épicas, ¡sin necesidad de llamar a los Autobots! 😉

En su «lista de los Reyes Magos» 👑👑👑 nos han pedido a un/a NLP Research Engineer que traiga en su mochila 🎒: 

  • Experiencia con NLP en la industria y/o el mundo académico durante al menos 5 años.
  • Trayectoria profesional con desarrollo de software en Python (Al menos 4 años), idealmente 3 de ellos en NLP.
  • Familiaridad con frameworks populares de Deep Learning como Pytorch, TensorFlow y librerías HuggingFace.
  • Temas de NLP con los que deberías estar familiarizado: QA, RAG, LLMs, NER, RE, TC, Transformadores, Atención, Recuperación de Información y Búsqueda de Palabras Clave.
  • Inglés fluido, tanto verbal como escrito. Ya que están en plena expansión a EE. UU. y tendrás compañeros que no hablan castellano.💂


Si vas a por el 🔟, valoran:

  • Estar al día de los últimos modelos de ML/NLP y que cuentes con gran interés en poner en producción soluciones innovadoras. Ah... recuerda que ellos han creado el suyo propio 🤔.
  • ¡¡Si ya has terminado tu doctorado en matemáticas, informática, estadística, física, ingeniería eléctrica o campos relacionados, estarán encantados de conocerte!! 
  • Gran interés en escalar prototipos y convertirlos en experiencias de usuario.
  • Valoran si tienes alguna publicación sobre NLP.
  • La buena capacidad de comunicación es necesaria, hacerte entender, para que aunque sepas mucho, seas capaz de transmitir tus conocimientos a tus compañeros y al resto de Nuclia. 📣😃

Tecnologías

Innegociable

  • Python
    Avanzado
  • PyTorch
    Avanzado

Estaría bien

  • Kubernetes
    Intermedio

Suma puntos

  • Pytest
    Avanzado

Otras habilidades

Innegociable

  • Adaptabilidad al cambio
  • Comunicación verbal
  • Atención al detalle
  • Capacidad de autogestión
  • Capacidad de abstracción

Estaría bien

  • Capacidad de dar feedback
  • Capacidad de recibir feedback

Suma puntos

  • Inteligencia emocional

Idiomas

Inglés
Fluido

¿Qué ofrecen?

Salario

60-70K

Horario

Flexible

Remoto

100%

💰 50€ bruto/mensual por gastos TT

🕓 Horario flexible 

💻 Equipo necesario para que puedas trabajar Facilitan portátil MBP y si necesitas algo adicional como (teclado, monitor, ratón) la empresa lo compra. 

🍲 Posibilidad de recibir retribución Flexible (Ticket, Guarde, Rest y Transporte).

What the FAQ?

Se están centrando en contratar personas que residan en España (por motivos administrativos) o Europa, cuya diferencia horaria no sea mayor a dos horas y que puedan acudir a la oficina al menos dos veces al año.

Consta de 3 fases, son ágiles, pues les corre prisa:

☝️ Entrevista con CTO (Founders)

✌️ Entrevista técnica (si has publicado artículos y cualquier trabajo que pueda compartir añadirá puntos).

👌 Entrevista final con Eudald (Founders).

NO. Tienen algún miembro del equipo trabajando desde Francia, con eso te decimos todo. 

Alguna vez organizan algún encuentro presencial semestral (teambuildings), pero ir es 100% opcional y todo coste asociado correrá por cuenta de Nuclia.