一系列在解析和格式化上的改进已集成到Java 9中,这些改进让相关功能更趋近于 Unicode区域设置数据标记语言 (LDML,Locale Data Markup Language)。上述改进由Stephen Colebourne负责,他是被广为采用的日期时间库JodaTime的创建者,还先导了Java 8中新java.time组件。遵循Unicode标准将为Java 9提供与其他非Java系统间更好的互操作性。
LDML是 Unicode通用区域设置数据资源库 (CLDR,Common Locale Data Repository)所使用的语言。作为Unicode联盟的项目之一,CLDR用于从世界各地收集并存储区域设置数据,这样应用开发人员可使程序更好地适应不同的文化。特别需要说明的是,LDML可解决日期、时间和时区上的问题,尤其是 日期的格式化与解析 。下面列出一些从Java 9中抽出的新特性,这些新进入Java 9的特性使得java.time更趋近LDML规范。
JDK-8148947 ,DataTimeFormatter的模式字母“g”:正如在LDML中定义的,字母“g”指代一个“简化儒略日期”,简化儒略日期与正常儒略日期的差别在于:(1)简化儒略日期取决于本地时间,而非GMT;(2)简化儒略日期中将午夜作为天的划分,而不是中午。
JDK-8155823 ,添加了日期时间模式“v”和“vvvv”:LDML格式“v”用于表示“通用非位置格式”(Generic Non-Location Format),例如“太平洋时间”。而LDML格式“vvvv”表示由特定城市所定义的“通用位置格式”(Generic Location Format),例如“洛杉矶时间”。
JDK-8148949 ,DataTimeFormatter的模式字母“A”、“n”、“N”:虽然不同于“n”和“N”,“A”是在LDML中定义的,但是当前Java的行为并未遵循LDML规范。规范中使用“A”表示一天中已过去的时间,以毫秒为单位,表示值的宽度可变。但是当前Java实现为固定宽度,即模式“AA”将不能解析任何大于99毫秒的值。“n”和“N”是Java对规范的一个扩展,分别表示一秒中已过去的纳秒值,以及一天中已过去的纳秒值。
JDK-8079628 ,包含“DD”格式的java.time.format.DateTimeFormatter对象在处理三位的积日值(Day-of-Year)时发生失败:类似于上面的固定宽度问题,只是用‘D’表示一位积日值。模式“DD”无法将“123”解析成一年中的第123天。
如上所述,Java 9更好地看齐LDML将会简化整个系统中的互操作性,这是由于不少技术已在不同程度上采用了LDML。稍提一些,Microsoft .Net使用LDML进行常规的区域设置数据互换,Node.js和Ruby也具有可用的软件包。
查看英文原文: Date and Time Formatting in Java 9 Will Get Closer to Unicode Locale Standards
感谢薛命灯对本文的审校。
给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注我们。