Clasificación de documentos

Se define como la tarea de asignar valores booleanos a cada par $\langle d_{j},c_{i}\rangle$ pertenecientes a $D\times C$ , donde $D$ es el dominio de los documentos y $C=\{c_{1},...,c_{n}\}$ es una colección de categorías predefinidas. T (verdadero) indica archivar un documento $d_{j}$ bajo $c_{i}$ , mientras F (falso) indica no archivar $d_{j}$ bajo $c_{i}$ .

Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de correo electrónico (spam / no spam)

Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.^[1]

Referencias

Enlaces externos

Publicaciones:

Fabrizio Sebastiani. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 [1] (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).

CLASIFICACION DE DOCUMENTOS by MARIA GABRIELA CUELLAR RAMIREZ

Clasificacion de Documentos en El Manejo de Informacion XD PDF

Clases y Clasificación de Documentos PDF Documento Multimedia

Clasificación de Documentos PDF

clasificacion de documentos Mind Map