你的位置:首页 > Java教程

[Java教程]第四章 语言模块


1.字符串的扩展与修复

语言脚本都对字符串特别关注,有关的方法特别多,这些方法有三大类:

第一类:与标签无关的实现:charAt,charCodeAt,concat,lastIndexOf,localeCompare,match,replace,slice,split,substr,substring,toLocaleLowerCase,toLocalUpperCase,toLowerCase,toUpperCase以及从Object继承来的方法。如,toString,valueOf

第二类:与标签有关的实现,都是对原字符串添加的一对标签:anchor,big,blink,blod,fixed,fontcolor,italics,link,small,strike,sub,sup

第三类是后来添加或未标准化的浏览器方法,如trim,quote,toSource,trimLeft,trimRight.其中,trim已经标准化,后四个是FF的私有实现。


先看看prototypejs添加的扩展,

gsub,sub,scan,truncate,strip,stripTags,stripScript,extractScripts,evalScripts,escapeHYML,unescapeHTML,parseQuery,toArray,succ,times,camelize,capitalize,underscore,dasherize,inspect,unfliterJSON,isJSON,evalJSON,include,starsWith,endsWith, empty,blank,interpolate。

其中,gsub,sub,scan与正则相关,直接取ruby的命名

truncate是字符串截取,非常有用

strip即trim,已标准化

stripTags去掉字符串的标签对,非常有用。

stripScript是单单把script标签去掉,露出script.text

escapeHTML与unescapeHTML是用户输入输出的操作定义,非常有用。

parseQuery基本是对url的search部分的操作。

inspect就是在两端加双引号,用于构建json。

empty和blank是对空白进行判定,很简单的方法。

prototype.js这些框架经常被其它框架抄去,看抄去的功能,我们就知道哪些方法有价值。

rightJs的字符串扩展:include , black , camelize , capitalize , dasherize , empty, endsWith,evalScripts , extarctScripts, includes, on , startsWidth , stripScripts, stripTags, toFlaot, toInt, trim , underscored

Mootools的字符扩展(原型扩展) test, contains , trim , clean , camelCase, hyphenate , capitalize , escapeRegExp , toInt , toFloat , hexToRgb, rgbToHex , substitute , stripScripts

dojo的字符串扩展, rep , pad , substitute , trim , rep就是repeat方法

Ext字符串扩展,capitalize , ellipsis , escape , escapeRegex format htmlDecode, htmlEncode leftPad, parseQueryString , trim , urlAppend

百度七巧板的字符扩展有:decodeHTML ,encodeHTML , escapeReg , filterFormat , format, formatColor , stripTags , toCamelCase, toHalfWidth , trim , wbr


下面举例实现方法:

contains方法:判定一个字符串是否包含另一个字符串。常规思维,使用正则,但每次都要用new RegExp来构造,太麻烦,性能太差。转而使用原生字符串方法。如indexOf , lastIdexOf , search 

  function contains (target, it) {    return target.lastIndexOf(it) != -1; //indexOf改成search, lastIndexOf也可以  }

在mootools版中,我们看到它支持更多的参数,目的是判定一个元素的className是否包含某个特定的class。众所周知,元素可以添加多个class,中间以空格隔开,使用mootoos的contains就很方便检测包含关系了。

  function contains (target, str, separator) {    return separator ? ( separator + target + separator).indexOf(separator + str +separator) > -1 : target.indexOf(str) > -1;  }

repeat方法: 将一个字符串重复n次,如repeat("ruby",2)得到rubyruby

版本1:利用空数组的join方法

  function repeat (target, n) {    return (new Array(n + 1)).join(target);  }

版本2.....6...

版本7,递归在浏览器下做了优化 ,包括ie6,属于最好的实现方式之一

  function repeat (target, n) {    if (n == 1){      return target    }    var s = repeat(target, Math.floor(n/2));    s += s;    if (n % 2) {      s += target;    }    return s;  }

byteLen方法:取得一个字符串所有字节的长度。这是一个后端转过来的方法。在前端,我们要用户填写文本,需要字节有限制。

版本1:假设字符每个字符Unicode编码小于等于255,byteLength为字符串长度。再遍历字符串,遇到unicode编码大于255时,为byteLength加1

function byteLen (target) {    var byteLength = target.length,       i = 0;    for ( ; i < target.length ; i++) {      if (target.charCodeAt(i) > 255) {        byteLength++;      }    }    return byteLength;  }

truncate方法,用于对字符串进行截断处理,当超过限定长度,默认添加三个点号等

  function truncate (target, length , truncation) {    length = length || 30;    truncation = truncation === void(0) ? '...' : truncation;    return target.length > length ? target.slice(0, length - truncation.length) + truncation : String(target);  }

camelize方法,转换为驼峰命名风格

  function camelize (target) {    if (target.indexOf('_') < 0 && target.indexOf('_') < 0) {      return target; //提前判断,提高响应效率    }    return target.replace(/[-_][^-_]/g , function(match){      return match.charCodeAt(1).toUpperCase();    })  }

underscored方法。转换为下划线风格

function underscored(target){    return target.replace(/([a-z\d])([A-Z])/g , '$1_$2').replace(/\-/g , '_').toLowerCase();  }

dasherize方法,转换为连字符风格,亦指css变量风格(承上面的方法)

  function dasherize(target){    return underscored(target).replace(/_/g, '-');  }

capitalize方法,首字母大写

  function capitalize(target) {    return target.charAt(0).toUpperCase() + target.substring(1).toLowerCase();  }

stripTags方法,移除字符中的html标签。但有一个缺陷,如果其中有script标签,会把不该显示的脚本也显示出来。

  function stripTags(target){    return String(target || "") .replace(/<[^>]+>/g, '');  }

escapeHTML和unescapeHTML略

escapeRegExp方法:将字符串安全格式转换为正则表达式的源码

  function escapeRegExp(target){    return target.replace(/([-.*+?^${}()|[\]\/\\])/g, '\\$1');  }

 pad方法,与trim方法相反,pad可以为字符串的某一端添加字符串。常见的是在日历的月份前面加补0,因此,被称为fillZero

  function pad(target,n){    var zero = new Array(n).join('0');    var str = zero + target;    var resulet = str.substr(-n);    return resulet;  }

高级方法,也是mass Framework使用的版本,支持更多的参数。允许从左边或从右填充。以及使用什么内容进行填充。

  function pad (target, n, filling, right, radix){    var num = target.toString(radix || 10);    filling = filling || "0";    while (num.length < n){      if(!right){        num = filling + num;      } else {        num += filling;      }      return num;    }  }

wbr方法,为目标字符串添加wbr换行。不过需要注意的是,它不是为每个字符串都插入<wbr>字样,而是相当于在组成文本节点的报语法中的每个字符后插入<wbr>字样。如果是aa<span>bb</span>cc,返回a<wbr>a<span>b<wbr>b</span>c<wbr>c<wbr>,在opear浏览器上,默认的css不会添加上wbr样式,需要在css上添加,wbr:after{content:"\00200B"}解决此问题

  function wbr (target){    return String(target).replace(/(?:<[^>]+>) | (?:&#?[0-9a-z]{2,6};) | (.{1})/gi,'$&<wbr>').replace(/><wbr>/g,'>');  }

format方法,在c语言中,有一个printf方法,我们可以在后面添加不同的类型的参数嵌入到将要输出的字符串中。这是非常有用的方法,因为在javascript中涉及到大量这样字符串拼接的工作 ,如果涉及逻辑,我们可以用模板,如果轻量点,我们可以用这个方法。

在不同的框架中名字不同,prototype.js 叫interpolate,Base2叫format,mootools叫substitute

  function format (str, object){    var array = Array.prototype.slice.call(arguments, 1);    return str.replace(/\\?\#{([^{}]+)\}/gm,function(match, name) {      if(match.charAt(0) == '\\')        return match.slice(1);      var index = Number(name)      if(index >= 0)        return array[index];      if (object && object[name] !== void 0)        return object[name];      return '';    });  }  var a = format("resulet is #{0}, #{1}",22,33)  console.log(a) // resulet is 22, 33  var b = format ( "#{name} is a #{sex} #{am}" ,{    name:"wangjie",    sex:"man",    am:"111"  });  console.log(b) // wangjie is a man 111

它支持两种传参方法,如果字符串的占位符为0,1,2这样的非零整数,要求传入两个或以上的参数,否则就传入一个对象,键名为占位符。

quote方法,在字符串的两端加上双引号。然后内部需要转义的地方都要转义。用于接装JSON的键名或模析系统中

  //code.google.com/jQuery-json  var escapeable = /["\\\x00-\x1f\x7f-\x9f]/g,          meta = {            '\b':'\\b',            '\t':'\\t',            '\n':'\\n',            '\f':'\\f',            '\r':'\\r',            '"':'\\"',            '\\':'\\\\'          };  function quote(target){    if (target.match(escapeable)){      return '"' + target.replace(escapeable,function(a) {        var c = meta[a];        if(typeof c === 'string') {          return c;        }        return '\\u' + ('0000' + c.charCodeAt(0).toString(16)).slice(-4)      }) + '"';    }    return '"' + target + '"';  }        

当然,如果浏览器支持原生的JSON,我们直接用JSON.stringify就行了,另外,FF在JSON发明之前,就支持String.prototype.quote与String.quote方法了,我们使用quote之前判定浏览器是否内置这些方法

字符串好像没有打的浏览器兼容问题,有的话是IE6,IE7不支持用数组中括号取它的每一个字符,需要用charAt来取。IE678不支持垂直分表符,因此有如下hack

var isIe678 = !+"\v1";

修复旧版本IE中的trim函数。这是一个很常用的操作,通常我们需要把表单的两侧空白清除掉

版本1,用了两次正则,实际速度非常惊人,主要得益于浏览器的内部优化。base2使用这种优化,引起了其它浏览器的跟风。于是正则的实现再也比不过字符串方法了。一个著名的例子,字符串拼接。直接相加比Array做成的StringBuffer还快。而StringBuffer技术在早些年备受推崇。

  function trim(str){    return str.replace(/^\s\s*/, '').replace(/\s\s*$/, '');  }

版本2

利用两个候选操作符链接两个正则,这样做就失去了浏览器优化的机会。由于看起来很优雅,很多类库都使用它。如jQuery,mootools

  function trim(str){    return str.replace(/^\s+|\s+$/g, '');  }

版本3

更好的改进版

  function trim(str){    var str = str.replace(/^\s\s*/, ""),        ws = /\s/,        i = str.length;  while (ws.test(str.charAt(--i)))    return str.slice(0, i + 1);  }

2.数组的扩展与修复

得益于Prototype.js的ruby式数组方法的侵略,让jser()的前端工程师大开眼界,原来对数组的操作是如此的丰富多彩。原来的javascript数组方法就是基于栈与队列的一套方法,像splice()还是很晚的时候加入的。让我们回顾一下用法。

pop()方法,出栈操作,删除并返回数组的最后一个元素

push()方法,出栈操作,向数组的末尾添加一个或更多元素,并返回新的长度。

shift()方法,出队操作,删除并返回数组的第一个元素

unshift()方法,入队操作,向数组的开头添加一个或更多的元素,返回新的长度

slice()方法,切片操作,从数组中分离出一个子数组,功能类似字符串的substring、slice、substr这三兄弟。此方法也常用于转换类数组对象为真正的数组

sort()方法,对数组元素进行排序,有一个可选参数,为比较函数。

reverse()方法,颠倒数组中元素的顺序。

splice()方法,用于用于同时对原数组进行增删操作,数组的remove方法就是基于它而写的

concat()方法,用于把原数组与参数合并成一个新数组,如果参数为数组,那么它会把其第一维的元素放入新的数组中。因此我们可以利用它实现数组的平坦化操作和克隆操作。

join()方法,把数组的所有元素放入一个字符串。元素通过指定的分隔符进行分隔。你可以想象成字符串的split的反操作。

在ecma262v5中,它把标准浏览器早已经实现的几个方法进行了入户处理。从此,我们可以安心的使用forEach()方法,不用担心他们被废弃掉了。

indexOf()方法,定位操作。同上,不是从后遍历。索引操作可以说是字符串的同名方法的翻版,存在就返回非负操作。不存在就返回-1.

forEach()方法。迭代操作。将数组的元素依次传入一个函数中执行,prototype.js对应的名字为 each。

map()方法,收集操作。将数组的元素依次传入一个函数中执行,然后把它们的返回值组成一个新数组返回。prototype.js对应的名字为collect.

fliter()方法。过滤操作,将数组的元素依次传入一个函数中执行,然后把返回值为true的那个元素放入新的数组中返回。prototype.js中它有三个名字,select、filter、findAll

some()方法,只要数组中有一个元素满足条件(放进函数返回true)。那么它就返回true.prototype.js对应的名字为any

every()方法,只有数组的元素满足调条件(放进给定函数返回true)它才返回true。prototype.js对应的名字为any

reduce()方法,归化操作。将数组中的元素归化为一个简单的数值。prototype.js对应的名字为inject

reduceRight()方法:归化操作,将数组中的元素归化为一个简单的数值。同上,不过是从后遍历。

由于许多扩展也基于这些新的标准方法,因此我们先给出IE678兼容方案,全部在数组原型上修复他们。

(未完待续

以下将更新:

3.数值的扩展与修复

4.函数的扩展与修复

5.日期的扩展与修复