Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

High Performance Language Technologies

CORDIS proporciona enlaces a los documentos públicos y las publicaciones de los proyectos de los programas marco HORIZONTE.

Los enlaces a los documentos y las publicaciones de los proyectos del Séptimo Programa Marco, así como los enlaces a algunos tipos de resultados específicos, como conjuntos de datos y «software», se obtienen dinámicamente de OpenAIRE .

Resultado final

Initial release of monolingual and parallel data sets (se abrirá en una nueva ventana)

This deliverable consists of initial set of textual data acquired from web and non-web sources, both in monolingual and parallel parts, after cleaning done in WP2.

Software for cleaning data sets (se abrirá en una nueva ventana)

Free and open-source software will be released on GitHub.

First language models trained (se abrirá en una nueva ventana)

Language models will be made available for download however it may not have all or the cleanest data.

Translation models for select language pairs (se abrirá en una nueva ventana)

Models available for download trained using the pipeline.

Publicaciones

FinGPT: Large Generative Models for a Small Language (se abrirá en una nueva ventana)

Autores: Luukkonen, Risto; Komulainen, Ville; Luoma, Jouni; Eskelinen, Anni; Kanerva, Jenna; Kupari, Hanna-Mari; Ginter, Filip; Laippala, Veronika; Muennighoff, Niklas; Piktus, Aleksandra; Wang, Thomas; Tazi, Nouamane; Scao, Teven Le; Wolf, Thomas; Suominen, Osma; Sairanen, Samuli; Merioksa, Mikko; Heinonen, Jyrki; Vahtola, Aija; Antao, Samuel; Pyysalo, Sampo
Publicado en: Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, 2023, ISBN 979-8-89176-060-8
Editor: Association for Computational Linguistics
DOI: 10.48550/arxiv.2311.05640

Towards Interpretable Mental Health Analysis with Large Language Models (se abrirá en una nueva ventana)

Autores: Yang, Kailai; Ji, Shaoxiong; Zhang, Tianlin; Xie, Qianqian; Kuang, Ziyan; Ananiadou, Sophia
Publicado en: Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, 2023, ISBN 979-8-89176-060-8
Editor: Association for Computational Linguistics
DOI: 10.48550/arxiv.2304.03347

Monolingual or Multilingual Instruction Tuning: Which Makes a Better Alpaca (se abrirá en una nueva ventana)

Autores: Chen, Pinzhen; Ji, Shaoxiong; Bogoychev, Nikolay; Kutuzov, Andrey; Haddow, Barry; Heafield, Kenneth
Publicado en: EACL, 2023, ISBN 979-8-89176-088-2
Editor: Association for Computational Linguistics
DOI: 10.48550/arxiv.2309.08958

Scaling Data-Constrained Language Models (se abrirá en una nueva ventana)

Autores: Muennighoff, Niklas; Rush, Alexander M.; Barak, Boaz; Scao, Teven Le; Piktus, Aleksandra; Tazi, Nouamane; Pyysalo, Sampo; Wolf, Thomas; Raffel, Colin
Publicado en: 2023, ISSN 2331-8422
Editor: NeurIPS'23
DOI: 10.48550/arxiv.2305.16264

Buscando datos de OpenAIRE...

Se ha producido un error en la búsqueda de datos de OpenAIRE

No hay resultados disponibles

Mi folleto 0 0