我有一个struct,它包含一个object字段,以使使用该对象更容易。我想测试性能(我预计会有所下降),但结果却非常令人惊讶。 带有struct的版本实际上更快:

这怎么可能?
以下是重现结果的完整测试代码。

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;
using System.Runtime.CompilerServices;
using System.Text;
using System.Threading.Tasks;

namespace ConsoleApplication68
{
    partial class Program
    {
        private const int Iterations = 100000000;

        static void Main(string[] args)
        {
            // Force JIT compilation.

            TimeWithoutBox(new MyObject());
            TimeWithoutBox(7);
            TimeBox(new MyObject());
            TimeBox(7);

            // The tests.

            var withoutBox = new TimeSpan();
            var box = new TimeSpan();

            for (int i = 0; i < 10; i++)
            {
                withoutBox += TimeWithoutBox(new MyObject());
                withoutBox += TimeWithoutBox(7);
                box += TimeBox(new MyObject());
                box += TimeBox(7);
            }

            Console.WriteLine("Without box: " + withoutBox);
            Console.WriteLine("With box: " + box);

            Console.ReadLine();
        }

        private static TimeSpan TimeBox(object value)
        {
            var box = new MyBox(value);

            var stopwatch = Stopwatch.StartNew();

            for (int i = 0; i < Iterations; i++)
            {
                TestBox(box);
            }

            return stopwatch.Elapsed;
        }

        private static TimeSpan TimeWithoutBox(object value)
        {
            var stopwatch = Stopwatch.StartNew();

            for (int i = 0; i < Iterations; i++)
            {
                TestWithoutBox(value);
            }

            return stopwatch.Elapsed;
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TestBox(MyBox box)
        {
            if (box.IsDouble)
                TakeDouble((double)box.Value);
            else if (box.IsObject)
                TakeObject((MyObject)box.Value);
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TestWithoutBox(object box)
        {
            if (box.GetType() == typeof(double))
                TakeDouble((double)box);
            else if (box.GetType() == typeof(MyObject))
                TakeObject((MyObject)box);
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TakeDouble(double value)
        {
            // Empty method to force consuming the cast.
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        private static void TakeObject(MyObject value)
        {
            // Empty method to force consuming the cast.
        }
    }

    struct MyBox
    {
        private readonly object _value;

        public object Value
        {
            get { return _value; }
        }

        public MyBox(object value)
        {
            _value = value;
        }

        public bool IsDouble
        {
            get { return _value.GetType() == typeof(double); }
        }

        public bool IsObject
        {
            get { return _value.GetType() == typeof(MyObject); }
        }
    }

    class MyObject
    {
    }
}
编辑:
我已将IsDoubleIsObject测试更改为与其他测试具有相同的语句。我已经重新执行了该应用程序,并且得到的时间完全相同。
编辑2:
该代码是使用版本构建版本(在 32位上编译,没有附加调试器的)进行测试的; .NET 4.5和Visual Studio2012。针对64位进行编译会产生截然不同的结果;在我的机器上:

最佳答案

我复制了确切的代码,并在没有调试器的情况下运行了Release(两者都很重要!),并且在x64上运行了它。结果:

Without box: 00:00:07.9650541
With box: 00:00:16.0958162

将测试更改为:
    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void TestBox(MyBox box)
    {
        if (box.Value.GetType() == typeof(double))
            TakeDouble((double)box.Value);
        else if (box.Value.GetType() == typeof(MyObject))
            TakeObject((MyObject)box.Value);
    }

使运行时间几乎相等:
Without box: 00:00:07.9488281
With box: 00:00:08.6084029

为什么?因为JIT决定不内联IsDouble,所以手动内联会有所帮助。这很奇怪,因为它的功能是如此之小。第13行的call是此调用。

现在为什么仍然存在一些性能差异? .NET JIT并不是目前最好的编译器...可能有些指令有些不同。您可以通过比较两个版本的反汇编来查找。我没有时间这样做,因为我希望两者之间的差异不会引起任何误解。

我希望C编译器能解决这个问题。该结构的行为应类似于它包含的单个object成员。内联小的方法。对于当今的编译器技术,这绝对是可行的。希望下一代JIT和NGEN能够做到这一点。目前正在开发一种新的JIT(RyuJIT),他们正在将优化从VC后端转移到NGEN(最近宣布)。

10-08 11:33