Trabajando con datos extraídos de las noticias publicadas en el Portal de Informática de la Universidad Técnica Federico Santa María (UTFSM) (El portal cambio, ya no funciona el script para bajar las noticias) he decidido hacer un grafo.
El grafo consiste en extraer n-gramas de los archivos de noticias y seleccionar algunos (en este caso profesores, lugares y roles). Con estos n-gramas se hace un análisis y se cuenta cuantas veces dos n-gramas se encuentran en una misma noticia.
Con estos datos se puede ver que profesores están más relacionados con un determinado campus o con otros profesores. Particularmente en el grafo mostrado más abajo se puede ver que estan semi-agrupados por area de investigación.
Pueden ver una imagen extraída de este grafo a continuación:
Los archivos utilizados son: scripts.tar, grafos.tar y informe.pdf

