值类型 引用类型

值类型表示存储在栈上的类型,包括简单类型(int、long、double、short)、枚举、struct定义;
引用类型表示存在堆上的类型,包括数组、接口、委托、class定义;
string 是引用类型

字符特殊性

  • 不可变性。字符串创建后,重新赋值的话,不会更新原有值,而是将引用地址更新到一个新的内存地址上。

  • 留存性。.NET运行时有个字符串常量池的概念,在编译时,会将程序集中所有字符串定义集中到一个内存池中,新定义的字符串会优先去常量池中查看是否已存在,如果存在,则直接引用已存在的字符串,否则会去堆上重新申请内存创建一个字符串。
    下面是关于字符串的一些单元测试,仔细观察下各个不同:

      [Fact]
      public void Base_Test()
      {
          string a = "abc";
          string b = "abc";
          //字符串的留存性,初始化后会放入常量池,b直接引用a的对象
          Assert.True(string.ReferenceEquals(a, b));
    
          string c = new String("abc");
          string d = new String("abc");
          //直接new的话,会重新分配内存
          Assert.False(string.ReferenceEquals(c, d));
          Assert.False(string.ReferenceEquals(a, c));
    
          string e = "abc";
          //这里e还是使用字符串的留存性,且使用的还是a的地址。证明c分配的内存引用并没有放入常量池替换
          Assert.True(string.ReferenceEquals(a, e));
          Assert.False(string.ReferenceEquals(c, e));
    
          string f = "abc" + "abc";
          string g = a + b;
          string h = "abcabc";
          //f在编译期间确定,实际还是从常量池中获取
          //IsInterned 表示从常量池中获取对应的字符串,获取失败返回null
          //a+b实际上是发生了字符串组合运算,内部重新new了一个新的字符串,所以f,g引用地址不同
          Assert.False(string.ReferenceEquals(f, g));
          Assert.True(string.ReferenceEquals(string.IsInterned(f), h));
          Assert.True(string.ReferenceEquals(f, h));
      }
    

Stringbuilder

字符串拼接是一个非常耗资源的操作,例如 string a="b"+"c" ,实际上创建了3个字符串"b"、"c"、"bc"。所以在这个时候就需要StringBuilder来专门执行字符串拼接操作了。
那么StringBuilder是如何实现的呢?
实际上StringBuilder内部维护了一个char数组,所有的appned类的操作都是将字符串转化为char存入数组。最后ToString()的时候才去组装string,减少了大量中间string的创建,是非常高效的字符串组装工具。
StringBuilder内部还有一个 Capacity 属性,用于定义数组的初始容量,默认值为25。超过容量会触发扩容操作。所以在实际操作中,如果我们能预估到拼接字符串的长度,在定义StringBuilder给 Capacity 属性附上一个合理的值,将会有更加高效的性能。

equals ==

  • equals:比较字符串的值
  • ==:比较字符串的引用地址是否相同

首先有个前提,我们所看到的equals,==,来自于System.Object对象,几乎所有的原生对象都对其进行了重写,才构成了我们目前的认知。重写equals必须重写GetHashCode。官方给出重写的实现约定如下:

Equals每个实现都必须遵循以下约定:

  • 自反性(Reflexive): x.equals(x)必须返回true.
  • 对称性(Symmetric): x.equals(y)为true时,y.equals(x)也为true.
  • 传递性(Transitive): 对于任何非null的应用值x,y和z,如果x.equals(y)返回true,并且y.equals(z)也返回true,那么x.equals(z)必须返回true.
  • 一致性(Consistence): 如果多次将对象与另一个对象比较,结果始终相同.只要未修改x和y的应用对象,x.equals(y)连续调用x.equals(y)返回相同的值l.
  • 非null(Non-null): 如果x不是null,y为null,则x.equals(y)必须为false

GetHashCode:

  • 两个相等对象根据equals方法比较时相等,那么这两个对象中任意一个对象的hashcode方法都必须产生同样的整数。
  • 在我们未对对象进行修改时,多次调用hashcode使用返回同一个整数.在同一个应用程序中多次执行,每次执行返回的整数可以不一致.
  • 如果两个对象根据equals方法比较不相等时,那么调用这两个对象中任意一个对象的hashcode方法,不一同的整数。但不同的对象,产生不同整数,有可能提高散列表的性能.

请慎重重写Equals和GetHashCode!!重写Equals方法必须要重写GetHashCode!!

关于equals方法参数 StringComparison

public enum StringComparison
{
    //
    // 摘要:
    //     使用区分区域性的排序规则和当前区域性比较字符串。
    CurrentCulture = 0,
    //
    // 摘要:
    //     通过使用区分区域性的排序规则、当前区域性,并忽略所比较的字符串的大小写,来比较字符串。
    CurrentCultureIgnoreCase = 1,
    //
    // 摘要:
    //     使用区分区域性的排序规则和固定区域性比较字符串。
    InvariantCulture = 2,
    //
    // 摘要:
    //     通过使用区分区域性的排序规则、固定区域性,并忽略所比较的字符串的大小写,来比较字符串。
    InvariantCultureIgnoreCase = 3,
    //
    // 摘要:
    //     使用序号(二进制)排序规则比较字符串。
    Ordinal = 4,
    //
    // 摘要:
    //     通过使用序号(二进制)区分区域性的排序规则并忽略所比较的字符串的大小写,来比较字符串。
    OrdinalIgnoreCase = 5
}

通常情况下最好使用 Ordinal或者OrdinalIgnoreCase,性能上最为高效。
除非有特殊的需要,不要使用 InvariantCulture或者InvariantCultureIgnoreCase,因为它要考虑所有Culture的字符转化对比情况,性能是极差的。
CurrentCulture和CurrentCultureIgnoreCase由于只有本地Culture对比,所以性能还可以接受。

参数传递

首先关于参数的存储,参数是存在栈上的。传递参数时,会将对象的“值”在栈copy一份,然后将副本的值传给方法。对象参数的传递分为两种 “值传递”和“引用传递”。(注意这里的引号

  • 值传递。默认的参数传递都是这种方式。会将对象的值在栈copy一份,然后将复制集的值传给方法。这里的值对于 值类型来说,即为对象副本的值。对于引用类型来说,即为对象在堆上的地址。
  • 引用传递。可以通过 ref out 关键字实现。对于值类型,会直接传入原对象在栈上的引用。对于引用类型,会传入原有对象的堆地址的引用。

这里string虽然是引用类型,但是产生的效果缺和值类型参数传递一样的。大家参考上面关于string的特性思考下原因。

静心慢慢回味下列单元测试

    [Fact]
    public void Base_Test()
    {
        //引用类型参数
        TestClass s = new TestClass();
        s.Tag = "abc";

        TestMethod m = new TestMethod();
        m.ReNew(s);
        //参数s 实际是对象 s的 地址拷贝。两者在栈上不同,但是指向的堆地址相同
        //在ReNew方法中 "参数s" 重新指向了一个新的对象,但是不影响旧的对象s
        Assert.True(string.Equals("abc", s.Tag));

        m.Change(s, "123");
        //Change方法是直接修改 参数s 指向的堆对象内的字段数据,所有对象s字段也发生了变化
        Assert.True(string.Equals("123", s.Tag));

        m.ReNew2(ref s);
        //注意和ReNew的区别,因为是ref 引用传递,所有原对象引用地址指向了新new的对象地址
        Assert.False(string.Equals("abc", s.Tag));
        Assert.True(string.Equals("cba", s.Tag));

        //值类型参数
        int val = 100;
        //Change方法内部改变了val的值,但不影响val原来的值
        m.Change(val);
        Assert.True(val == 100);

        m.Change(out val);
        //使用out标记,改变了val原来的值
        Assert.True(val == 123);
    }
}

public class TestMethod
{
    public void ReNew(TestClass c)
    {
        c = new TestClass() { Tag = "cba" };
    }

    public void ReNew2(ref TestClass c)
    {
        c = new TestClass() { Tag = "cba" };
    }

    public void Change(TestClass c, string tag)
    {
        c.Tag = tag;
    }

    public void Change(int a)
    {
        a = 123;
    }
    public void Change(out int a)
    {
        a = 123;
    }
}

public class TestClass
{
    public string Tag { get; set; }
}

ref out

ref out都是用来标识通过引用传递方式传参。不同的是,ref 需要参数在方法调用前初始化,out 则要求参数在方法体内赋值。

装箱 拆箱

装箱,即值类型转化为引用类型;从内存存储角度,将值类型从栈的值copy,然后放到堆上,并附加额外的引用类型功能内存占用(如类型指针、同步块索引等)。
拆箱,即引用类型转化为值类型。从内存存储角度,获取引用类型的指针,得到值copy,放到栈上。
从性能角度上,装箱的性能损耗>拆箱的性能损耗。在实际运用中,我们要尽量避免装箱和拆箱,这也是泛型类型出现后,一个非常大的作用就是避免了装箱拆箱的大量操作。

08-29 19:24