Seqbim 2023 - 20-21 novembre à Lille

Présentation

SeqBIM (anciennement sous le nom seqBio) constitue les journées annuelles du groupe de travail SeqBIM, commun au GDR BIM et au GDR IM. Elles portent notamment sur la combinatoire ou l’algorithmique du texte ainsi que leurs applications à la bioinformatique. Cette réunion s’adresse aux chercheurs et chercheuses en informatique, statistique, bio-informatique et biologie qui travaillent sur les séquences, vues comme objet combinatoire ou comme objet biologique.

Ces journées sont notamment l’occasion pour les doctorantes, doctorants, post-doctorantes et post-doctorants de présenter à la communauté leurs travaux et de rencontrer des collègues du domaine.

En 2023, les journées ont eu lieu les 20 et 21 novembre, dans le cadre des journées du GDR BIM qui se sont tenues du 20 au 23 novembre à Lille. La journée plénière du 22 novembre a eu pour thématique l’apprentissage pour la bioinformatique.

Soumission

Vous pouvez soumettre un résumé simple (1 page maximum) ou étendu (5 pages maximum). Nous encourageons notamment la soumission de résultats négatifs, susceptibles de générer des discussions, réflexions, idées. La soumission se fait via le site Easychair. Des templates Latex et de Traitement de texte sont disponibles.

Les résumés peuvent être rédigés en anglais ou en français.

En ce qui concerne les présentations, les slides devront être en anglais et nous encourageons à ce que l’exposé soit également fait en anglais, même s’il n’y a pas d’obligation. 

La date limite de soumission était le 8 octobre 2023, 23h59 heure française.

Inscription

Les inscriptions se faisaient jusqu’au 8 novembre via la page des journées du GDR BIM, dans lesquelles s’inscrivent les journées SeqBIM.

Dates importantes

  • date limite de soumission : 08/10
  • notification aux auteurs et autrices : 23/10
  • date limite d’inscription : 08/11

Programme

Lors des journées, nous avons eu deux exposés invités : l’un donné par Birte Kehr (Algorithmic Bioinformatics, du Leibniz Institute for Immunotherapy) et l’autre par Christopher Quince (High-Resolution Microbiomics, Earlham Institute).

Les résumés des présentations sont accessibles ici.

Lundi 20 novembre
10:15 – 10:45 Accueil
10:45 – 11:00 Introduction
Graph session
11:00 – 11:30 Towards an edit distance between pangenome graphs
S. Dubois, B. Linard, M. Zytnicki, C. Lemaitre, T. Faraut
11:30 – 12:00 Developing phylogeny-colored de Bruijn graphs for bacterial gene birth detection
A. Kaul, K. Břinda, M. Baym
12:00 – 12:30 Recent advancements in approximate colored compacted de Bruijn graph representations
Y. Shibuya, P. Peterlongo, G. E. Pibiri
12:30 – 13:00 KmerStore: interactive manipulation and visualization of graphs from collections of sequences
C. Paperman, C. Marchet
13:00 – 14:30 Repas
14:30 – 15:30 Invited talk: Genotyping structural variation: from simple to complex
Birte Kehr
15:30 – 16:00 Approximate Cartesian Tree Matching: An approach Using Swaps
B. Auvray, T. Lecroq, J. David, R. Groult
16:00 – 16:30 Pause
Peptide session
16:30 – 17:00 Towards solving the peptidomics problem with ProSpect
E. Benoist, G. Jean, H. Rogniaux, G. Fertin, D. Tessier
17:00 – 17:30 DeTox: A pipeline for the Detection of Toxins in venomous organisms
A. Ringeval, S. Farhat, A. Fedosov, M. Gerdol, S. Greco, L. Mary, M. Vittoria Modica, N. Puillandre
17:30 – 18:00 Présentation de SeqBIM.
Présentation des nouvelles et nouveaux.
Mardi 21 novembre
09:20 – 10:20 Invited talk: Resolving genomes from metagenomes
Christopher Quince
10:20 – 10:50 Mathematical Model of Phylogenetic Compression
V. Hendrychová, K. Břinda
10:50 – 11:20 Pause
k-mer session
11:20 – 11:50 Kmer2Reads an associative index for Third Generation Sequencing data
L. Vandamme, B. Cazaux, A. Limasset
11:50 – 12:20 Réduction de l’espace utilisé par le Counting Quotient Filter
V. Levallois, Y. Dufresne, P. Peterlongo
12:20 – 12:50 A space-efficient, locality-preserving and dynamic data structure for indexing k-mers
I. Martayan, A. Limasset, C. Marchet, B. Cazaux
12:50 – 14:15 Repas
Third generation sequencing session
14:15 – 14:45 Mapping-friendly Sequence Reductions to process compressed genomic data
R. Faure, B. Hilaire, D. Lavenier
14:45 – 15:15 Improved sub-genomic RNA prediction with the ARTIC protocol
T. Baudeau, K. Sahlin
15:15 – 15:45 Assessing alternatively spliced transcript diversity with long reads
L. Marchand, H. Touzet, J.-S. Varré
Exposé de Birte Kehr : « Genotyping structural variation: from simple to complex »

Structural variants (SVs) contribute significantly to human genetic diversity, affect the risk of many complex diseases, and can be the cause of rare inherited diseases. By definition, SVs affect at least 50 base pairs of sequence and comprise many types of variants ranging from simple deletions to complex rearrangements that involve multiple DNA segments. Estimates of the number of SVs were recently corrected from thousands to tens of thousands per human genome by using long read data, which demonstrates that the majority of SVs have remained undetected in previous studies on short read data. Given that short read data is still cheaper and much more abundant than long read data, the aim of my research group is to make use of these available masses of data. In my talk I will introduce our approaches for calling SVs using data from short read sequencing of human genomes. In the first part, I will present our approach PopDel for detecting simple deletions in short read data of very many genomes simultaneously and briefly outline our extension of PopDel to simple duplications and inversion. In the second part, I will introduce our unpublished work on genotyping known complex structural variants including corresponding measures of genotype uncertainty.

Informations pratiques

Les journées se sont tenues sur le campus cité scientifique à Villeneuve d’Ascq, à 15 minutes de métro (ligne 1, direction 4 cantons, arrêt Cité scientifique) depuis les gares Lille Flandres ou Lille Europe. Il faut compter environ 30 minutes entre la sortie du train et l’arrivée dans la salle.

Les journées ont eu lieu dans l’amphi Painlevé, au dernier étage du bâtiment M1. Sur la carte ci-dessous, la station de métro est au niveau du marqueur bleu, en haut à droite et l’entrée du bâtiment M1 au niveau du marqueur rouge, en bas.

Comités de programme et d’organisation

Comité de programme
  • Karel Břinda (IRISA, Inria Rennes)
  • Laurent Bulteau (IGM, Université Gustave Eiffel) – co-responsable
  • Bastien Cazaux (CRIStAL, Université de Lille)
  • Annie Chateau (LIRMM, Université Montpellier)
  • Rayan Chikhi (Institut Pasteur Paris)
  • Gilles Didier (IMAG, Université Montpellier) – co-responsable
  • Gregory Kucherov (IGM, Université Gustave Eiffel)
  • Vincent Lacroix (LBBE, Université Lyon 1)
  • Thierry Lecroq (LITIS, Université Rouen)
  • Claire Lemaitre (IRISA, Inria Rennes) – co-responsable
  • Antoine Limasset (CRIStAL, CNRS)
  • Camille Marchet (CRIStAL, CNRS)
  • Pierre Peterlongo (IRISA, Inria Rennes)
  • Mikaël Salson (CRIStAL, Université de Lille) – co-responsable
  • Blerina Sinaimeri (LUISS, Université de Rome)
  • Tatiana Starikovskaya (ENS Paris)
  • Hélène Touzet (CRIStAL, CNRS)
  • Raluca Uricaru (LABRI, Université Bordeaux)
  • Riccardo Vicedomini (IRISA, CNRS)
  • Mathias Weller (LIGM, Université Gustave Eiffel)
  • Matthias Zytnicki (MIAT, Inrae)
Comité local d’organisation
  • Thomas Baudeau
  • Bastien Cazaux
  • Camille Marchet
  • Justine Merlan
  • Mikaël Salson
  • Hélène Touzet

Soutiens

Logo GDR BIM
Logo GDR IM
Logo de l'université de Lille

Crédit photo : Velvet, licence CC BY SA, sur Wikimedia Commons