feb 08 18

BOM en UTF-8 o Caracteres raros en archivos de texto

Tiempo estimado de lectura: 0,57 minutos

Puede que alguna vez hayan visto ciertos caracteres raros al principio de archivos de texto cuando los abrieron con algún editor que no suelen usar como puede ser el VI (vim) o el nano en linux o simplemente algún otro software en Windows (sólo lo corroboré con el MySQL Yog). Incluso ciertos scripts pueden dar error cuando el compilador los detecta.

Si tu archivo de texto tiene en el comienzo alguna de estas cadenas: “EF BB BF“, “FF FE“, “FF FE 00 00” o simplemente algo como “.” no te asustes, podes borrarlas sin problemas. Se trata del BOM (Bit Order Mask), algo así como una cabecera del encoding UTF-8/16/32.

La mayoría de los editores de código permiten guardar los formatos UTF sin el BOM. Sin embargo muchas veces lo tiene configurado por defecto y lo guardan junto con el texto. Siempre se sugiere que se guarde sin el BOM para evitar problemas de incompatibilidad con otros editores o compiladores.

Manejo del BOM en editores conocidos:

  • Notepad++ Lo trae desactivado por defecto y no permite activarlo cuando se utiliza UTF
  • Dreamweaver Lo trae desactivado por defecto y permite activarlo cuando se utiliza el “Save As” o “Guardar Como”
  • Zend Studio Algunas versiones lo traen por defecto activado y se requiere entrar a los settings para desactivarla

Tu editor ¿Guarda el BOM? Si, es así, cuidado.

Más información en: http://unicode.org/faq/utf_bom.html

Copame! Digg it Digg it Reddit Del.icio.us

    3 Comentarios

  1. Matías


    Por eso hay que usar un editor como la gente. Para Windows: Crimson Editor

  2. Lucas Zallio


    Totalmente de acuerdo Matías. A mi me gusta mucho el notepad++ para windows. Es extremadamente liviano y soporta muchos lenguajes y encodings de manera correcta.

  3. marcoss


    Yo también uso el Notepad++ en Windows y además de cumplir con esa función, te permite cambiar la codificación de los archivos muy facilmente, ideal para cuando el dump de la base de datos salió para el tuje :P

Deja un Comentario

Tags permitidos:

  • <a href="" title="">
  • <abbr title="">
  • <acronym title="">
  • <blockquote cite="">
  • <code>
  • <em>
  • <strong>