웹상의 언어

이 페이지에서는 어디부터 시작해야 할지 전혀 몰라 당황스러워하는 웹 국제화 초심자를 위한 몇 가지 오리엔테이션을 제공합니다. 사이트 자료를 쉽게 이용할 수 있도록 돕고자 이 페이지를 마련한 것입니다.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

기초 정보

HTML 및 XML 기반 형식을 사용하면 언어에 민감한 작업에 대해 도구 및 응용 프로그램이 해당 정보를 사용할 수 있도록 문서 또는 텍스트 범위의 자연어(즉, 프로그램 언어가 아닌 인간 언어)를 선언할 수 있습니다. 그러한 작업에는 글꼴 또는 단락 스타일 적용, 텍스트에서 음성으로 전환, 철자 검사 등이 포함됩니다.

컨텐츠의 언어 정보가 정확할수록 응용 프로그램의 유용성과 설득력이 개선됩니다.

또한 선택이 가능할 경우 원하는 언어로 데이터를 볼 수 있도록 브라우저 또는 사용자 에이전트가 제공한 언어 정보를 사용하는 것도 가능합니다.

자세히...

언어를 선언하는 이유에서는 컨텐츠 제작자와 개발자들이 언어 정보를 선언해야 하는 이유를 약간 더 자세하게 알아봅니다.

언어 선언

컨텐츠 제작자는 관련 웹 기술로 문서 또는 텍스트 범위의 언어를 선언하는 방법을 알고 있어야 합니다. XHTML, SVG, SSML 등 대부분의 XML 기반 형식은 XML 사양에 정의된 xml:lang 속성을 사용하지만, HTML의 lang 속성과 같은 다른 마크업도 존재할 수 있습니다.

컨텐츠 제작자는 도구에서 처리가 가능하도록 문서 또는 텍스트 범위 언어 선언 간에 차이를 두어야 하는지 여부를 고려해야 하며, 이와 함께 리소스(즉, 메타데이터)를 보기 원하는 대상도 지정해야 합니다. 예를 들어, (X)HTML 형식에서는 약간 다른 접근 방법을 적용해야 할 수도 있습니다. 또한 스크립트 및 문자 인코딩 선언과 언어 선언을 혼동하지 않아야 합니다.

컨텐츠 제작자와 웹마스터는 또한 표준 방법으로 언어 값을 사용하는 방식도 알고 있어야 합니다. W3C 사양에 대한 현재의 표준 접근 방법은 BCP 47에 표현된 규칙을 사용하는 것입니다. 이 사양은 RFC 3066이나 RFC 1766 같은 이전 사양을 대체하며, ISO 표준과 국가별 표준에서 제공하는 것보다 더 많은 정보를 포함하고 있습니다. 또한 IANA Language Subtag Registry를 사용해서 ISO 사양이 아닌 언어 태그를 조회해야 합니다.

웹마스터나 서버 설정 업무를 맡고 있는 사람은 요청한 파일과 함께 언어 관련 HTTP 정보를 전송하도록 서버를 설정해야 할 수도 있습니다. 이러한 작업은 일반적으로 컨텐츠 협상의 일부로 진행되며, 이때 서버는 사용자 브라우저 설정에 따라 여러 가지 대체 문서 버전 중 하나를 사용자에게 전송합니다.

언어 정보를 사용하는 사이트 탐색

서버에 HTTP 요청이 전달되면 요청측 사용자 에이전트는 보통 언어 기본 설정에 대한 정보를 전송합니다. 이때 서버는 이 정보를 사용하여 해당 언어로 된 문서 버전(그러한 버전이 있는 경우)을 반환할 수 있습니다.

최종 사용자들은 해당 언어 설정이 올바르게 설정되어 있는지 확인하는 방법과, 그렇지 않을 경우 언어 설정을 변경하는 방법에 대해 알고 있어야 합니다.

웹마스터는 언어 기반 컨텐츠 협상 관리를 위해 서버를 설정하는 방법을 알아야 합니다.

다국어 사이트를 다루는 웹 디자이너와 개발자는 방문자들을 올바른 리소스로 안내하는 방법을 고려해야 합니다.

스타일 지정에 언어 정보 사용

대부분의 브라우저에서, CSS 선택기를 사용하여 텍스트 범위 언어에 따라 다른 스타일을 적용할 수 있습니다. 예를 들어, 영어 문서 내에서, 컨텐츠가 태국어로 표시된다는 사실만 확인하면 포함된 태국어 텍스트가 어디에든 표시될 수 있도록 특정 글꼴을 할당하고 줄 높이를 적절히 조정할 수 있습니다.

CSS에서, 스타일 시트 개발자들은 content 속성이 지원되는 경우라면 이 속성을 갖는 선택기를 사용해서 링크 대상의 언어를 자동으로 지정할 수 있습니다.

마크업 형식에 맞게 언어 정보 디자인

스키마 또는 사양 개발자들은 개발 중인 형식에 제작자들이 문서의 기본 언어와 문서 내 언어 변경 사항을 식별할 수 있도록 할지 여부를 고려해야 합니다.

스키마 또는 사양 개발자들은 또한 XML 기반 형식에 적절한 xml:lang을 사용할 시기와 언어 정보 지정을 위해 다른 속성 또는 요소를 만들어야 할 시기도 명확히 판단해야 합니다.

자세히...

스키마 개발자
자연어 지정을 위한 마크업 정의