今天做网站【标签】筛选功能时,出现了这么个奇葩的问题。
我是直接通过<a>标签中href来跳转的,url中包含汉字
<a href="/tags/标签A">标签A</a>
后台代码是这样的:
@RequestMapping(value = "/tags/{tagname}") public String tags(@PathVariable String tagname) { // ISO-8859-1 ==> UTF-8 进行编码转换 tagname = encode_to_utf8(tagname); // 其余处理略 }
按理说这样就行了,各大浏览器也正常执行了。
但是,一不下心发现,只要URL中出现“ 充 ”这个汉字,直接就报404错误
例如这样:
<a href="/tags/标签充A">标签充A</a>
奇葩吧。
经过漫长的调查发现,原因 有可能 是:
充 这个汉字在URL中直接提交,经过浏览器转码后,会变成一串包含“ / ”的“乱码”。
后来经过类似测试发现,果然只要URL中包含“ / ”的参数,都无法通过 @PathVariable 正确匹配。
有人说不如改成这样:
方案1:
在Server端通过urlencode把汉字先进行UTF-8编码,然后扔到前端。
但是这样做的话,URL就会变成这个丑样,这和乱码有什么区别?真心不喜欢。
<a href="/tags/%D6%D0%B9%FA">标签充A</a>
还有人说可以这样
方案2:
<a href="/tags?tagname=标签充A">标签充A</a>
然后在Controller中用 @RequestParam 来接收参数,这样确实是可以的。
但是SEO大神说,url中包含?的动态参数后,有可能会被蜘蛛重复抓取,不利于 SEO。
难道就没有办法在保持URL格式与汉字都不变的情况,实现这个功能吗?
最后终于发现,有人这样搞定了!
前端:
<a href="/tags/标签充A">标签充A</a>
后端:
@RequestMapping(value = "/tags/**") public String tags(HttpServletRequest request) { // ISO-8859-1 ==> UTF-8 进行编码转换 String tagname = extractPathFromPattern(request); tagname = ToolUtils.encodeStr(tagname); // 其余处理略 } // 把指定URL后的字符串全部截断当成参数 // 这么做是为了防止URL中包含中文或者特殊字符(/等)时,匹配不了的问题 private static String extractPathFromPattern( final HttpServletRequest request) { String path = (String) request.getAttribute(HandlerMapping.PATH_WITHIN_HANDLER_MAPPING_ATTRIBUTE); String bestMatchPattern = (String) request.getAttribute(HandlerMapping.BEST_MATCHING_PATTERN_ATTRIBUTE); return new AntPathMatcher().extractPathWithinPattern(bestMatchPattern, path); }
搞完之后,不管你输入什么样的URL,都能进入到指定的方法!
<a href="/tags/标签充A">标签充A</a>
<a href="/tags/标签充A/asd/asd">标签充A</a>
<a href="/tags/标签充A/BB/cc.html">标签充A</a>
参考原文地址:http://kamatama41.hatenablog.com/entry/20130411/1365668200