Puede que alguna vez hayan visto ciertos caracteres raros al principio de archivos de texto cuando los abrieron con algún editor que no suelen usar como puede ser el VI (vim) o el nano en linux o simplemente algún otro software en Windows (sólo lo corroboré con el MySQL Yog). Incluso ciertos scripts pueden dar error cuando el compilador los detecta.
Si tu archivo de texto tiene en el comienzo alguna de estas cadenas: “EF BB BF“, “FF FE“, “FF FE 00 00” o simplemente algo como “.” no te asustes, podes borrarlas sin problemas. Se trata del BOM (Bit Order Mask), algo asà como una cabecera del encoding UTF-8/16/32.
La mayorÃa de los editores de código permiten guardar los formatos UTF sin el BOM. Sin embargo muchas veces lo tiene configurado por defecto y lo guardan junto con el texto. Siempre se sugiere que se guarde sin el BOM para evitar problemas de incompatibilidad con otros editores o compiladores.
Manejo del BOM en editores conocidos:
- Notepad++ Lo trae desactivado por defecto y no permite activarlo cuando se utiliza UTF
- Dreamweaver Lo trae desactivado por defecto y permite activarlo cuando se utiliza el “Save As” o “Guardar Como”
- Zend Studio Algunas versiones lo traen por defecto activado y se requiere entrar a los settings para desactivarla
Tu editor ¿Guarda el BOM? Si, es asÃ, cuidado.
Más información en: http://unicode.org/faq/utf_bom.html










3 Comentarios
MatÃas
febrero 20th, 2008 at 10:23 pm
Por eso hay que usar un editor como la gente. Para Windows: Crimson Editor
Lucas Zallio
febrero 21st, 2008 at 1:02 am
Totalmente de acuerdo MatÃas. A mi me gusta mucho el notepad++ para windows. Es extremadamente liviano y soporta muchos lenguajes y encodings de manera correcta.
marcoss
febrero 23rd, 2008 at 12:49 pm
Yo también uso el Notepad++ en Windows y además de cumplir con esa función, te permite cambiar la codificación de los archivos muy facilmente, ideal para cuando el dump de la base de datos salió para el tuje :P