# zangzi

**Repository Path**: shengpin/zangzi

## Basic Information

- **Project Name**: zangzi
- **Description**: 脏字处理
- **Primary Language**: C#
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2017-09-22
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# zangzi
再度改进，在脏字可能存在的情况下，例如出现了多个脏字前Length-1部分时，性能相比http://www.cnblogs.com/xingd/archive/2008/01/31/1060425.html中描述的又提升了300%~400%。

直接贴出全部代码了，通过新增的一个byte[char.MaxValue]和BitArray(char.MaxValue)，减少了大量的Substring和GetHashCode的调用。耗的内存也不算多，除HashSet外，仅需要144k内存。

引用此文或者使用此代码请说明出处，谢谢，以便于我将来的更新。

2008-02-02修订：if (index > 0 || (fastCheck[text[index]] & 1) == 0) 应去掉index > 0的判断，这个优化考虑的不够成熟。感谢sumtec和灵感之源指出错误。避免最短匹配时，可以在 if (hash.Contains(sub)) 之后，可以加入判断 if ((fastLength[begin] >> Math.Min(j,7)) == 0)，然后再return true。