Cedulari.cat és dues coses alhora. D'una banda, una base de dades: el llistat d'autors, llibres i edicions de la història editorial catalana, amb un focus únic en el corpus pre-ISBN que no consta enlloc més.
De l'altra, un conjunt d'eines per a grans models de llenguatge que els dona allò que a la IA generalista li falta: procedència, traçabilitat i fonts verificables, en comptes d'una caixa negra que al·lucina.
I.El buit
Mentre els models s'alimenten només del que ja és digital, hi ha tot un segle de llibre català —entre els anys vint i l'arribada de l'ISBN— que no té catàleg accessible. Ni a les biblioteques, ni a les tesis, ni a la xarxa.
II.Per què ho poden fer els llibreters de vell
Perquè aquest coneixement no és a cap base de dades pública: viu al cap i als fitxers de cinc o sis llibreters de vell del país. Són ells els qui han tingut els exemplars a les mans, els qui saben de tirades, pseudònims, variants de coberta i edicions clandestines.
Cap algoritme no ha vist mai aquests llibres; ells sí.
Cedulari.cat converteix aquest saber d'ofici, acumulat durant dècades, en la base de dades que faltava.