编写高质量代码改善C#程序——使用泛型集合代替非泛型集合(建议20)

内容摘要
软件开发过程中,不可避免会用到集合,C#中的集合表现为数组和若干集合类。不管是数组还是集合类,它们都有各自的优缺点。如何使用好集合是我们在开发过程中必须掌握的技巧。不要
文章正文

软件开发过程中,不可避免会用到集合,C#中的集合表现为数组和若干集合类。不管是数组还是集合类,它们都有各自的优缺点。如何使用好集合是我们在开发过程中必须掌握的技巧。不要小看这些技巧,一旦在开发中使用了错误的集合或针对集合的方法,应用程序将会背离你的预想而运行。

建议20:使用泛型集合代替非泛型集合

在建议1中我们知道,如果要让代码高效运行,应该尽量避免装箱和拆箱,以及尽量减少转型。很遗憾,在微软提供给我们的第一代集合类型中没有做到这一点,下面我们看ArrayList这个类的使用情况:

  ArrayList al=new ArrayList();
      al.Add(0);
      al.Add(1);
      al.Add("mike");
      foreach (var item in al)
      {
        Console.WriteLine(item);
      }

上面这段代码充分演示了我们可以将程序写得多么糟糕。

首先,ArrayList的Add方法接受一个object参数,所以al.Add(1)首先会完成一次装箱;其次,在foreach循环中,待遍历到它时,又将完成一次拆箱。

在这段代码中,整形和字符串作为值类型和引用类型,都会先被隐式地强制转型为object,然后在foreach循环中又被转型回来。

同时,这段代码也是非类型安全的:我们然ArrayList同时存储了整型和字符串,但是缺少编译时的类型检查。虽然有时候需要有意这样去实现,但是更多的时候,应该尽量避免。缺少类型检查,在运行时会带来隐含的Bug。集合类ArrayList如果进行如下所示的运算,就会抛出一个IvalidCastException:          

 ArrayList al=new ArrayList();
      al.Add(0);
      al.Add(1);
      al.Add("mike");
      int t = 0;
      foreach (int item in al)
      {
        t += item;
      }

ArrayList同时还提供了一个带ICollection参数的构造方法,可以直接接收数组,如下所示:

var intArr = new int[] {0, 1, 2, 3};
ArrayList al=new ArrayList(intArr);

该方法内部实现一样糟糕,如下所示(构造方法内部最终调用了下面的InsertRange方法):

public virtual void InsertRange(int index, ICollection c)
{
  if (c == null)
  {
    throw new ArgumentNullException("c", Environment.GetResourceString("ArgumentNull_Collection"));
  }
  if ((index < 0) || (index > this._size))
  {
    throw new ArgumentOutOfRangeException("index", Environment.GetResourceString("ArgumentOutOfRange_Index"));
  }
  int count = c.Count;
  if (count > 0)
  {
    this.EnsureCapacity(this._size + count);
    if (index < this._size)
    {
      Array.Copy(this._items, index, this._items, index + count, this._size - index);
    }
    object[] array = new object[count];
    c.CopyTo(array, 0);
    array.CopyTo(this._items, index);
    this._size += count;
    this._version++;
  }
}

概括来讲,如果对大型集合进行循环访问、转型或装箱和拆箱操作,使用ArrayList这样的传统集合对效率影响会非常大。鉴于此,微软提供了对泛型的支持。泛型使用一对<>括号将实际类型括起来,然后编译器和运行时会完成剩余的工作。微软也不建议大家使用ArrayList这样的类型了,转而建议使用它们的泛型实现,如List<T>。

注意,非泛型集合在System.Collections命名空间下,对应的泛型集合则在System.Collections.Generic命名空间下。

建议一开始的那段代码的泛型实现为:           

List<int> intList = new List<int>();
      intList.Add(1);
      intList.Add(2);
      //intList.Add("mike");
      foreach (var item in intList)
      {
        Console.WriteLine(item);
      }

代码中被注释的那一行不会被编译通过,因为“mike"不是整型,这里就体现了类型安全的特点。

下面比较了非泛型集合和泛型集合在运行中的效率:

 static void Main(string[] args)
    {
      Console.WriteLine("开始测试ArrayList:");
      TestBegin();
      TestArrayList();
      TestEnd();
      Console.WriteLine("开始测试List<T>:");
      TestBegin();
      TestGenericList();
      TestEnd();
    }
    static int collectionCount = 0;
    static Stopwatch watch = null;
    static int testCount = 10000000;
    static void TestBegin()
    {
      GC.Collect();  //强制对所有代码进行即时垃圾回收
      GC.WaitForPendingFinalizers(); //挂起线程,执行终结器队列中的终结器(即析构方法)
      GC.Collect();  //再次对所有代码进行垃圾回收,主要包括从终结器队列中出来的对象
      collectionCount = GC.CollectionCount(0);  //返回在0代码中执行的垃圾回收次数
      watch = new Stopwatch();
      watch.Start();
    }

    static void TestEnd()
    {
      watch.Stop();
      Console.WriteLine("耗时:" + watch.ElapsedMilliseconds.ToString());
      Console.WriteLine("垃圾回收次数:" + (GC.CollectionCount(0) - collectionCount));
    }

    static void TestArrayList()
    {
      ArrayList al = new ArrayList();
      int temp = 0;
      for (int i = 0; i < testCount; i++)
      {
        al.Add(i);
        temp = (int)al[i];
      }
      al = null;
    }

    static void TestGenericList()
    {
      List<int> listT = new List<int>();
      int temp = 0;
      for (int i = 0; i < testCount; i++)
      {
        listT.Add(i);
        temp = listT[i];
      }
      listT = null;
    }

输出为:

开始测试ArrayList:

耗时:2375

垃圾回收次数:26

开始测试List<T>:

耗时:220

垃圾回收次数:5

以上介绍了编写高质量代码改善C#程序——使用泛型集合代替非泛型集合(建议20),有关编写高质量代码建议1到建议157,本完整会持续更新,敬请关注,谢谢。


代码注释

作者:喵哥笔记

IDC笔记

学的不仅是技术,更是梦想!