martes, 9 de junio de 2015


La conclusión de este trabajo de análisis de lexicografía es que la palabra Político aparece con mayor frecuencia en todo el texto de este post. Pero como ya indique en otro apartado y en el análisis es que el tema principal de este blog es que la palabra corrupción tan solo aparece dos veces y al final de la lista.
Se conoce por corrupción a la manipulación de los medios públicos  de una o varias personas  con el fin de obtener  beneficios propios, enmarañando los fines de estos en perjuicio de la sociedad a la que se deberían servir.
Esta corrupción aunque pueda parecer un caso de actualidad que nos está afectando a todos los ciudadanos, es a lo largo del transcurso de la historia de  España que ha sucedido esto. Los primeros vestigios históricos se encuentran en el Siglo de Oro por medio de la literatura Picaresca y bajo el reinado de Felipe III. Siendo el duque de Lerma cuando ejerció el poder del gobierno de España uno de los más visibles corruptos.
Esta corrupción se ha ido repitiendo a lo largo de toda la historia y en el s. XIX la reina Regente María Cristina de Borbón tuvo muchas participaciones en negocios turbios, siendo rechazada continuamente por el pueblo. Una de las fuertes fue una trata ilegal con esclavos.[1]
Actualmente tenemos casos en todos los gobiernos ya sean partidos de centro, izquierda o de derechas, pero no podemos olvidar el caso Pujol, Caso Noos, etc.
Me gustaría tener una solución, pero es difícil como dice un artículo en el país, contra la raíz de la corrupción y contra la impunidad de los chorizos, por no poner otras palabras más fuertes existe solo un arma: el rechazo de la clase política por parte de la sociedad, los que no tienen poder.
La corrupción y el crimen no se combaten desde el poder, ya que también es corrupto y a la vez corruptor, es la gente de a pie quien tiene que acabar con esta pandemia. Las personas comunes no creen en el poder.
Lo más grave es que el poder lo sabe y conoce que una parte de la sociedad acaba aprovechándose de la corrupción del poder, recibe algo a cambio y acaba siendo comprada.
Los españoles han vuelto a considerar la corrupción como uno de los grandes problemas del país. Decenas de escándalos políticos han acaecido en el país. La sociedad está harta y esto está más acentuado debido a la crisis económica que estamos padeciendo.
Según un barómetro del Cis, un 40 % de la población cree que el mayor problema actual es este y otro 30% dice que es la clase política la mayor causa de este problema.
Más de 300 políticos están imputados en casos de corrupción en España, por su presunta implicación.
En fin, no pienso a que por muchas medidas que tomen los gobiernos se pueda erradicar de una vez este grave problema que nos afecta a todos los ciudadanos de este país.




[1] Wikipedia España y la corrupción

lunes, 8 de junio de 2015

El análisis de lexicógrafia también se puede utilizar como forma a través de un texto para poder ver el lugar donde están las palabras mas repetidas como es el caso que presento mas abajo


En el análisis del texto nos encontramos con palabras que no tienen ninguna importancia a la hora de extraer conclusiones como en este caso la palabra de, la y que aparecen en el corpus de la lista de palabras, pero en este caso si bajamos veremos que la palabra política es la que aparece con mayor frecuencia.
El siguiente trabajo va a consistir en un examen de análisis de lexicografía a través del programa AntConc, este es un programa de ayuda para el análisis de corpus. Permite sacar datos de un corpus con frecuencias de palabras. Antconc no analiza el corpus, lo que hace consiste en mostrar el texto de forma diferente por frecuencias, por patrones de búsqueda.
Para mi análisis de lexicografía he utilizado un blog de política en el que se trata de la corrupción en España y los políticos que están en este mundo. El blog de Libertad Digital escrito por Percival Manglano, titulado ¿hay algún político honrado en España?
El primer paso fue descargar Antconc y a continuación a través del Files cargar el documento del blog sobre política que había guardado en bloc de notas. Pero anteriormente y después de muchísimas pruebas tuve que ir probando a ver cuál era el tipo de codificación letra que me iba bien para que existiese una relación entre carácter y su representación por la máquina. Cada carácter textual es reconocido por el ordenador por un código numérico binario: para lo que nosotros es una letra o un número, para el ordenador es un conjunto de siete u ocho ceros y unos y que no me saliesen caracteres extraños o palabras cortadas por la mitad. El tipo de codificación que he utilizado ha sido la de Unicode UTF-8
A continuación y a través del espacio de Word List hice una extracción términos y después de eliminar artículos, pronombres etc., vi que la palabra que más se ha usado con 14 frecuencias ha sido la de político, pero en cambio el tema de este blog que es la corrupción tan sólo aparece dos veces y al final de la lista.  También aparece con 4 posiciones la palabra política.
La primera columna (Ranc) nos muestra la posición de la palabra
La segunda columna (frec) muestra el número de veces que se repite la palabra
La tercera columna (Word) muestra la palabra en sí.
Las palabras que más se han repetido han sido con 6 frecuencias españoles y poder.
En cambio han aparecido con dos posiciones las palabras que darían sentido al tema de  este texto como capacidad, caos, cinismo, ciudadano, corrupción, corromperse.
 RANC                                               FREC                                  WORD
7         
            
13
politicos
15                                                                    
6                         
españoles
17       
            
6                         
poder
28                       

31       
4

4
Leyes

política             
33       
37                                    
 3
3
Estado
revolución
46                       
47                       
48
49       
50                       
51
54                       
56                       
61                       
64
66
68       
71
72                       
73       
74                       
75
77       
                                                       
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
casos
cinismo            
ciudadano      
confianza
corromperse 
corrupción
desengaño
dictadura        
engañas
español
gente
heridas
partido
prestaciones
vigentes
robando
tentación
vida




 Encima de estas columnas aparecen el numero total de Tokens que consiste en el conjunto de caracteres separados por espacio en blanco y el numero de types que son Tokens iguales


En el apartado de concordances, al pinchar la palabra que más se ha utilizado en este blog ha sido (político) y  han aparecido las frases donde estaba situada la palabra y las que la acompañaban.