[转载][译]Kinect for Windows SDK开发入门(六)：骨骼追踪基础上 - yangecnu - 博客园

2015-12-14mikel阅读(1047)

来源： [转载][译]Kinect for Windows SDK开发入门(六)：骨骼追踪基础上 – yangecnu – 博客园

Kinect产生的景深数据作用有限，要利用Kinect创建真正意义上交互，有趣和难忘的应用，还需要除了深度数据之外的其他数据。这就是骨骼追踪技术的初衷，骨骼追踪技术通过处理景深数据来建立人体各个关节的坐标,骨骼追踪能够确定人体的各个部分，如那部分是手，头部，以及身体。骨骼追踪产生 X,Y,Z数据来确定这些骨骼点。在上文中，我们讨论了景深图像处理的一些技术。骨骼追踪系统采用的景深图像处理技术使用更复杂的算法如矩阵变换，机器学习及其他方式来确定骨骼点的坐标。

本文首先用一个例子展示骨骼追踪系统涉及的主要对象，然后在此基础上详细讨论骨骼追踪中所涉及的对象模型。

1. 获取骨骼数据

本节将会创建一个应用来将获取到的骨骼数据绘制到UI界面上来。在开始编码前，首先来看看一些基本的对象以及如何从这些对象中如何获取骨骼数据。在进行数据处理之前了解数据的格式也很有必要。这个例子很简单明了，只需要骨骼数据对象然后将获取到的数据绘制出来。

彩色影像数据，景深数据分别来自ColorImageSteam和DepthImageStream，同样地，骨骼数据来自 SkeletonStream。访问骨骼数据和访问彩色影像数据、景深数据一样，也有事件模式和 “拉”模式两种方式。在本例中我们采用基于事件的方式，因为这种方式简单，代码量少，并且是一种很普通基本的方法。KinectSensor对象有一个名为SkeletonFrameReady事件。当SkeletonStream中有新的骨骼数据产生时就会触发该事件。通过AllFramesReady 事件也可以获取骨骼数据。在下一节中，我们将会详细讨论骨骼追踪对象模型，现在我们只展示如何从SkeletonStream流中获取骨骼数据。 SkeletonStream产生的每一帧数据都是一个骨骼对象集合。每一个骨骼对象包含有描述骨骼位置以及骨骼关节的数据。每一个关节有一个唯一标示符如头(head)、肩(shoulder)、肘(dlbow)等信息和3D向量数据。

现在来写代码。首先创建一个新的wpf工程文件，添加Microsoft.Kinect.dll。添加基本查找和初始化传感器的代码，这些代码参考之前的文章。在开始启动传感器之前，初始化SkeletonStream数据流，并注册KinectSensor对象的SkeletonFrameReady事件，这个例子没有使用彩色摄像机和红外摄像机产生的数据，所以不需要初始化这些数据流。UI界面采用默认的，将Grid的名称改为LayoutRoot，之后就再Grid里面绘制。代码如下：

<Window x:Class="KinectSkeletonTracking.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="MainWindow" Height="350" Width="525">
    <Grid x:Name="LayoutRoot" Background="White">
        
    </Grid>
</Window>

后台逻辑代码如下：

private KinectSensor kinectDevice;
private readonly Brush[] skeletonBrushes;//绘图笔刷
private Skeleton[] frameSkeletons;

public MainWindow()
{
    InitializeComponent();
    skeletonBrushes = new Brush[] { Brushes.Black, Brushes.Crimson, Brushes.Indigo, Brushes.DodgerBlue, Brushes.Purple, Brushes.Pink };
    KinectSensor.KinectSensors.StatusChanged += KinectSensors_StatusChanged;
    this.KinectDevice = KinectSensor.KinectSensors.FirstOrDefault(x => x.Status == KinectStatus.Connected);

}

public KinectSensor KinectDevice
{
    get { return this.kinectDevice; }
    set
    {
        if (this.kinectDevice != value)
        {
            //Uninitialize
            if (this.kinectDevice != null)
            {
                this.kinectDevice.Stop();
                this.kinectDevice.SkeletonFrameReady -= KinectDevice_SkeletonFrameReady;
                this.kinectDevice.SkeletonStream.Disable();
                this.frameSkeletons = null;
            }

            this.kinectDevice = value;

            //Initialize
            if (this.kinectDevice != null)
            {
                if (this.kinectDevice.Status == KinectStatus.Connected)
                {
                    this.kinectDevice.SkeletonStream.Enable();
                    this.frameSkeletons = new Skeleton[this.kinectDevice.SkeletonStream.FrameSkeletonArrayLength];
                    this.kinectDevice.SkeletonFrameReady += KinectDevice_SkeletonFrameReady;
                    this.kinectDevice.Start();
                }
            }
        }
    }
}

private void KinectSensors_StatusChanged(object sender, StatusChangedEventArgs e)
{
    switch (e.Status)
    {
        case KinectStatus.Initializing:
        case KinectStatus.Connected:
        case KinectStatus.NotPowered:
        case KinectStatus.NotReady:
        case KinectStatus.DeviceNotGenuine:
            this.KinectDevice = e.Sensor;
            break;
        case KinectStatus.Disconnected:
            //TODO: Give the user feedback to plug-in a Kinect device.                    
            this.KinectDevice = null;
            break;
        default:
            //TODO: Show an error state
            break;
    }
}

以上代码中，值得注意的是frameSkeletons数组以及该数组如何在流初始化时进行内存分配的。Kinect能够追踪到的骨骼数量是一个常量。这使得我们在整个应用程序中能够一次性的为数组分配内存。为了方便，Kinect SDK在SkeletonStream对象中定义了一个能够追踪到的骨骼个数常量FrameSkeletonArrayLength，使用这个常量可以方便的对数组进行初始化。代码中也定义了一个笔刷数组，这些笔刷在绘制骨骼时对多个游戏者可以使用不同的颜色进行绘制。也可以将笔刷数组中的颜色设置为自己喜欢的颜色。

下面的代码展示了SkeletonFrameReady事件的响应方法，每一次事件被激发时，通过调用事件参数的OpenSkeletonFrame方法就能够获取当前的骨骼数据帧。剩余的代码遍历骨骼数据帧的Skeleton数组frameSkeletons，在UI界面通过关节点将骨骼连接起来，用一条直线代表一根骨骼。UI界面简单，将Grid元素作为根结点，并将其背景设置为白色。

private void KinectDevice_SkeletonFrameReady(object sender, SkeletonFrameReadyEventArgs e)
{
    using (SkeletonFrame frame = e.OpenSkeletonFrame())
    {
        if (frame != null)
        {
            Polyline figure;
            Brush userBrush;
            Skeleton skeleton;

            LayoutRoot.Children.Clear();
            frame.CopySkeletonDataTo(this.frameSkeletons);


            for (int i = 0; i < this.frameSkeletons.Length; i++)
            {
                skeleton = this.frameSkeletons[i];

                if (skeleton.TrackingState == SkeletonTrackingState.Tracked)
                {
                    userBrush = this.skeletonBrushes[i % this.skeletonBrushes.Length];

                    //绘制头和躯干
                    figure = CreateFigure(skeleton, userBrush, new[] { JointType.Head, JointType.ShoulderCenter, JointType.ShoulderLeft, JointType.Spine,
                                                                JointType.ShoulderRight, JointType.ShoulderCenter, JointType.HipCenter
                                                                });
                    LayoutRoot.Children.Add(figure);

                    figure = CreateFigure(skeleton, userBrush, new[] { JointType.HipLeft, JointType.HipRight });
                    LayoutRoot.Children.Add(figure);

                    //绘制作腿
                    figure = CreateFigure(skeleton, userBrush, new[] { JointType.HipCenter, JointType.HipLeft, JointType.KneeLeft, JointType.AnkleLeft, JointType.FootLeft });
                    LayoutRoot.Children.Add(figure);

                    //绘制右腿
                    figure = CreateFigure(skeleton, userBrush, new[] { JointType.HipCenter, JointType.HipRight, JointType.KneeRight, JointType.AnkleRight, JointType.FootRight });
                    LayoutRoot.Children.Add(figure);

                    //绘制左臂
                    figure = CreateFigure(skeleton, userBrush, new[] { JointType.ShoulderLeft, JointType.ElbowLeft, JointType.WristLeft, JointType.HandLeft });
                    LayoutRoot.Children.Add(figure);

                    //绘制右臂
                    figure = CreateFigure(skeleton, userBrush, new[] { JointType.ShoulderRight, JointType.ElbowRight, JointType.WristRight, JointType.HandRight });
                    LayoutRoot.Children.Add(figure);
                }
            }
        }
    }
}

循环遍历frameSkeletons对象，每一次处理一个骨骼，在处理之前需要判断是否是一个追踪好的骨骼，可以使用Skeleton对象的 TrackingState属性来判断，只有骨骼追踪引擎追踪到的骨骼我们才进行绘制，忽略哪些不是游戏者的骨骼信息即过滤掉那些 TrackingState不等于SkeletonTrackingState.Tracked的骨骼数据。Kinect能够探测到6个游戏者，但是同时只能够追踪到2个游戏者的骨骼关节位置信息。在后面我们将会详细讨论TrackingState这一属性。

处理骨骼数据相对简单，首先，我们根Kinect追踪到的游戏者的编号，选择一种颜色笔刷。然后利用这只笔刷绘制曲线。CreateFigure方法为每一根骨骼绘制一条直线。GetJointPoint方法在绘制骨骼曲线中很关键。该方法以关节点的三维坐标作为参数，然后调用KinectSensor对象的MapSkeletonPointToDepth方法将骨骼坐标转换到深度影像坐标上去。后面我们将会讨论为什么需要这样转换以及如何定义坐标系统。现在我们只需要知道的是，骨骼坐标系和深度坐标及彩色影像坐标系不一样，甚至和UI界面上的坐标系不一样。在开发Kinect应用程序中，从一个坐标系转换到另外一个坐标系这样的操作非常常见，GetJointPoint方法的目的就是将骨骼关节点的三维坐标转换到UI绘图坐标系统，返回该骨骼关节点在 UI上的位置。下面的代码展示了CreateFigure和GetJointPoint这两个方法。

private Polyline CreateFigure(Skeleton skeleton, Brush brush, JointType[] joints)
{
    Polyline figure = new Polyline();

    figure.StrokeThickness = 8;
    figure.Stroke = brush;

    for (int i = 0; i < joints.Length; i++)
    {
        figure.Points.Add(GetJointPoint(skeleton.Joints[joints[i]]));
    }

    return figure;
}

private Point GetJointPoint(Joint joint)
{

    DepthImagePoint point = this.KinectDevice.MapSkeletonPointToDepth(joint.Position, this.KinectDevice.DepthStream.Format);

    point.X *= (int)this.LayoutRoot.ActualWidth / KinectDevice.DepthStream.FrameWidth;
    point.Y *= (int)this.LayoutRoot.ActualHeight / KinectDevice.DepthStream.FrameHeight;

    return new Point(point.X, point.Y);
}

值得注意的是，骨骼关节点的三维坐标中我们舍弃了Z值，只用了X,Y值。Kinect好不容易为我们提供了每一个节点的深度数据(Z值)而我们却没有使用，这看起来显得很浪费。其实不是这样的，我们使用了节点的Z值，只是没有直接使用，没有在UI界面上展现出来而已。在坐标空间转换中是需要深度数据的。可以试试在GetJointPoint方法中，将joint的Position中的Z值改为0，然后再调用 MapSkeletonPointToDepth方法，你会发现返回的对象中x和y值均为0，可以试试，将图像以Z值进行等比缩放，可以发现图像的大小是和Z值(深度)成反的。也就是说，深度值越小，图像越大，即人物离Kinect越近，骨骼数据越大。

运行程序，会得到如下骨骼图像，这个是手握键盘准备截图的姿势。一开始可能需要调整一些Form窗体的大小。程序会为每一个游戏者以一种颜色绘制骨骼图像，可以试着在Kinect前面移动，可以看到骨骼图像的变化，也可以走进然后走出图像以观察颜色的变化。仔细观察有时候可以看到绘图出现了一些奇怪的图案，在讨论完骨骼追踪相关的API之后，就会明白这些现象出现的原因了。

2. 骨骼对象模型

Kinect SDK中骨骼追踪有一些和其他对象不一样的对象结构和枚举。在SDK中骨骼追踪相关的内容几乎占据了三分之一的内容，可见Kinect中骨骼追踪技术的重要性。下图展示了骨骼追踪系统中涉及到的一些主要的对象模型。有四个最主要的对象，他们是 SkeletonStream，SkeletonFrame，Skeleton和Joint。下面将详细介绍这四个对象。

2.1 SkeletonStream对象

SkeletonStream对象产生SkeletonFrame。从SkeletonStream获取骨骼帧数据和从ColorStream及 DepthStream中获取数据类似。可以注册SkeletonFrameReady事件或者AllFramesReady事件通过事件模型来获取数据，或者是使用OpenNextFrame方法通过“拉”模型来获取数据。不能对同一个SkeletonStream同时使用这两种模式。如果注册了 SkeletonFrameReady事件然后又调用OpenNextFrame方法将会返回一个InvalidOperationException异常。

SkeletonStream的启动和关闭

除非启动了SkeletonStream对象，否则，不会产生任何数据，默认情况下，SkeletonStream对象是关闭的。要使 SkeletonStream产生数据，必须调用对象的Enabled方法。相反，调用Disable方法能够使SkeletonStream对象暂停产生数据。SkeletonStream有一个IsEnabled方法来描述当前SkeletonStream对象的状态。只有 SkeletonStream对象启动了，KinectSensor对象的SkeletonFrameReady事件才能被激活。如果要使用“拉”模式来获取数据SkeletonStream也必须启动后才能调用OpenNextFrame方法。否则也会抛出 InvalidOperationException异常。

一般地在应用程序的声明周期中，一旦启动了SkeletonStream对象，一般会保持启动状态。但是在有些情况下，我们希望关闭 SkeletonStream对象。比如在应用程序中使用多个Kinect传感器时。只有一个Kinect传感器能够产生骨骼数据，这也意味着，即使使用多个Kinect传感器，同时也只能追踪到两个游戏者的骨骼数据信息。在应用程序执行的过程中，有可能会关闭某一个Kinect传感器的 SkeletonStream对象而开启另一个Kinect传感器的SkeletonStream对象。

另一个有可能关闭骨骼数据产生的原因是出于性能方面的考虑，骨骼数据处理是很耗费计算性能的操作。打开骨骼追踪是可以观察的到CPU的占用率明显增加。当不需要骨骼数据时，关闭骨骼追踪很有必要。例如，在有些游戏场景中可能在展现一些动画效果或者播放视频，在这个动画效果或者视频播放时，停止骨骼追踪可能可以使得游戏更加流畅。

当然关闭SkeletonStream也有一些副作用。当SkeletonStream的状态发生改变时，所有的数据产生都会停止和从新开始。 SkeletonStream的状态改变会使传感器重新初始化，将TimeStamp和FrameNumber重置为0。在传感器重新初始化时也有几毫秒的延迟。

平滑化

在前面的例子中，会注意到，骨骼运动会呈现出跳跃式的变化。有几个原因会导致出现这一问题，可能是应用程序的性能，游戏者的动作不够连贯，也有可能是 Kinect硬件的性能问题。骨骼关节点的相对位置可能在帧与帧之间变动很大，这回对应用程序产生一些负面的影像。除了会影像用户体验和不愉快意外，也可能会导致用户的形象或者手的颤动抽搐而使用户感到迷惑。

SkeletonStream对象有一种方法能够解决这个问题。他通过将骨骼关节点的坐标标准化来减少帧与帧之间的关节点位置差异。当初始化 SkeletonStream对象调用重载的Enable方法时可以传入一个TransformSmoothParameters参数。 SkeletonStream对象有两个与平滑有关只读属性：IsSmoothingEnabled和SmoothParameters。当调用 Enable方法传入了TransformSmoothParameters是IsSmoothingEnabled返回true而当使用默认的不带参数的Enable方法初始化时，IsSmoothingEnabled对象返回false。SmoothParameters属性用来存储定义平滑参数。 TransformSmoothParameters这个结构定义了一些属性：

修正值(Correction)属性，接受一个从0-1的浮点型。值越小，修正越多。
抖动半径(JitterRadius)属性，设置修正的半径，如果关节点“抖动”超过了设置的这个半径，将会被纠正到这个半径之内。该属性为浮点型，单位为米。
最大偏离半径(MaxDeviationRadius)属性，用来和抖动半径一起来设置抖动半径的最大边界。任何超过这一半径的点都不会认为是抖动产生的，而被认定为是一个新的点。该属性为浮点型，单位为米。
预测帧大小(Prediction)属性，返回用来进行平滑需要的骨骼帧的数目。
平滑值(Smoothing)属性，设置处理骨骼数据帧时的平滑量，接受一个0-1的浮点值，值越大，平滑的越多。0表示不进行平滑。

对骨骼关节点进行平滑处理会产生性能开销。平滑处理的越多，性能消耗越大。设置平滑参数没有经验可以遵循。需要不断的测试和调试已达到最好的性能和效果。在程序运行的不同阶段，可能需要设置不同的平滑参数。

Note：SDK使用霍尔特指数平滑(Holt Double Exponential Smoothing)来对减少关节点的抖动。指数平滑数据处理与时间有关。骨骼数据是时间序列数据，因为骨骼引擎会以某一时间间隔不断产生一帧一帧的骨骼数据。平滑处理使用统计方法进行滑动平均，这样能够减少时间序列数据中的噪声和极值。类似的处理方法最开始被用于金融市场和经济数据的预测。

骨骼追踪对象选择

默认情况下，骨骼追踪引擎会对视野内的所有活动的游戏者进行追踪。但只会选择两个可能的游戏者产生骨骼数据，大多数情况下，这个选择过程不确定。如果要自己选择追踪对象，需要使用AppChoosesSkeletons属性和ChooseSkeletons方法。默认情况下AppChoosesSkeleton属性为false，骨骼追踪引擎追踪所有可能的最多两个游戏者。要手动选择追踪者，需要将 AppChoosesSkeleton设置为true，并调用ChooseSkeletons方法，传入TrackingIDs已表明需要追踪那个对象。 ChooseSkeletons方法接受一个，两个或者0个TrackingIDs。当ChooseSkeletons方法传入0个参数时，引擎停止追踪骨骼信息。有一些需要注意的地方：

如果调用ChooseSkeletons方法时AppChoosesSkeletons的属性为false，就会引发InvalidOperationExcepthion的异常。
如果在SkeletonStream开启前，经AppChoosesSkeletons设置为true，只有手动调用ChooseSkeleton方法后才会开始骨骼追踪。
在AppChoosesSkeletons设置为 true之前，骨骼引擎自动选择追踪的游戏者，并且继续保持这些该游戏者的追踪，直到用户手动指定需要追踪的游戏者。如果自动选择追踪的游戏者离开场景，骨骼引擎不会自动更换追踪者。
将AppChoosesSkeletons冲新设置为false后，骨骼引擎会继续对之前手动设置的游戏者进行追踪，直到这些游戏者离开视野。当游戏这离开视野时骨骼引擎才会选择其他的可能的游戏者进行追踪。

2.2 SkeletonFrame

SkeletonStream产生SkeletonFrame对象。可以使用事件模型从事件参数中调用OpenSkeletonFrame方法来获取 SkeletonFrame对象，或者采用”拉”模型调用SkeletonStream的OpenNextFrame来获取SkeletonFrame对象。SkeletonFrame对象会存储骨骼数据一段时间。同以通过调用SkeletonFrame对象的CopySkeletonDataTo方法将其保存的数据拷贝到骨骼对象数组中。SkeletonFrame对象有一个SkeletonArrayLength的属性，这个属性表示追踪到的骨骼信息的个数。

时间标记字段

SkeletonFrame的FrameNumber和Timestamp字段表示当前记录中的帧序列信息。FrameNumber是景深数据帧中的用来产生骨骼数据帧的帧编号。帧编号通常是不连续的，但是之后的帧编号一定比之前的要大。骨骼追踪引擎在追踪过程中可能会忽略某一帧深度数据，这跟应用程序的性能和每秒产生的帧数有关。例如，在基于事件获取骨骼帧信息中，如果事件中处理帧数据的时间过长就会导致这一帧数据还没有处理完就产生了新的数据，那么这些新的数据就有可能被忽略了。如果采用“拉”模型获取帧数据，那么取决于应用程序设置的骨骼引擎产生数据的频率，即取决于深度影像数据产生骨骼数据的频率。

Timestap字段记录字Kinect传感器初始化以来经过的累计毫秒时间。不用担心FrameNumber或者Timestamp字段会超出上限。FrameNumber是一个32位的整型，Timestamp是64位整型。如果应用程序以每秒30帧的速度产生数据，应用程序需要运行2.25年才会达到FrameNumber的限，此时Timestamp离上限还很远。另外在Kinect传感器每一次初始化时，这两个字段都会初始化为0。可以认为FrameNumber和Timestamp这两个值是唯一的。

这两个字段在分析处理帧序列数据时很重要，比如进行关节点值的平滑，手势识别操作等。在多数情况下，我们通常会处理帧时间序列数据，这两个字段就显得很有用。目前SDK中并没有包含手势识别引擎。在未来SDK中加入手势引擎之前，我们需要自己编写算法来对帧时间序列进行处理来识别手势，这样就会大量依赖这两个字段。

帧描述信息

FloorClipPlane字段是一个有四个元素的元组Tuple<int,int,int,int>,每一个都是 Ax+By+Cz+D=0地面平面(floor plane)表达式里面的系数项。元组中第一个元素表示A，即x前面的系数，一次类推，最后一个表示常数项，通常为负数，是Kinect距离地面高度。在可能的情况下SDK会利用图像处理技术来确定这些系数。但是有时候这些系数不肯能能够确定下来，可能需要预估。当地面不能确定时 FloorClipPlane中的所有元素均为0.

2.3 Skeleton

Skeleton类定义了一系列字段来描述骨骼信息，包括描述骨骼的位置以及骨骼中关节可能的位置信息。骨骼数据可以通过调用SkeletonFrame 对象的CopySkeletonDataTo方法获得Skeleton数组。CopySkeletonDataTo方法有一些不可预料的行为，可能会影响内存使用和其引用的骨骼数组对象。产生的每一个骨骼数组对象数组都是唯一的。以下面代码为例：

Skeleton[] skeletonA = new Skeleton[frame.SkeletonArrayLength];
Skeleton[] skeletonB = new Skeleton[frame.SkeletonArrayLength];

frame.CopySkeletonDataTo(skeletonA);
frame.CopySkeletonDataTo(skeletonB);

Boolean resultA = skeletonA[0] == skeletonB[0];//false
Boolean resultB = skeletonA[0].TrackingId == skeletonB[0].TrackingId;//true

上面的代码可以看出，使用CopySkeletonDataTo是深拷贝对象，会产生两个不同的Skeleton数组对象。

TrackingID

骨骼追踪引擎对于每一个追踪到的游戏者的骨骼信息都有一个唯一编号。这个值是整型，他会随着新的追踪到的游戏者的产生添加增长。和之前帧序号一样，这个值并不是连续增长的，但是能保证的是后面追踪到的对象的编号要比之前的编号大。另外，这个编号的产生是不确定的。如果骨骼追踪引擎失去了对游戏者的追踪，比如说游戏者离开了Kinect的视野，那么这个对应的唯一编号就会过期。当Kinect追踪到了一个新的游戏者，他会为其分配一个新的唯一编号，编号值为 0表示这个骨骼信息不是游戏者的，他在集合中仅仅是一个占位符。应用程序使用TrackingID来指定需要骨骼追踪引擎追踪那个游戏者。调用 SkeletonStream对象的ChooseSkeleton能以初始化对指定游戏这的追踪。

TrackingState

该字段表示当前的骨骼数据的状态。下表展示了SkeletonTrackingState枚举的可能值机器含义：

Position

Position一个SkeletonPoint类型的字段，代表所有骨骼的中间点。身体的中间点和脊柱关节的位置相当。改字段提供了一个最快且最简单的所有视野范围内的游戏者位置的信息，而不管其是否在追踪状态中。在一些应用中，如果不用关心骨骼中具体的关节点的位置信息，那么该字段对于确定游戏者的位置状态已经足够。该字段对于手动选择要追踪的游戏者 (SkeletonStream.ChooseSkeleton)也是一个参考。例如，应用程序可能需要追踪距离Kinect最近的且处于追踪状态的游戏者，那么该字段就可以用来过滤掉其他的游戏者。

ClippedEdges

ClippedEdges字段用来描述追踪者的身体哪部分位于Kinect的视野范围外。他大体上提供了一个追踪这的位置信息。使用这一属性可以通过程序调整Kinect摄像头的俯仰角或者提示游戏者让其返回到视野中来。该字段类型为FrameEdges，他是一个枚举并且有一个 FlagsAtrribute自定义属性修饰。这意味着ClippedEdges字段可以一个或者多个FrameEdges值。下面列出了 FrameEdges的所有可能的值。

当游戏者身体的某一部分超出Kinect视场范围时，就需要对骨骼追踪产生的数据进行某些改进，因为某些部位的数据可能追踪不到或者不准确。最简单的解决办法就是提示游戏者身体超出了Kinect的某一边界范围让游戏者回到视场中来。例如，有时候应用程序可能不关心游戏者超出Kinect视场下边界的情况，但是如果超出了左边界或者右边界时就会对应用产生影响，这是可以针对性的给游戏者一些提示。另一个解决办法是调整Kinect设备的物理位置。 Kinect底座上面有一个小的马达能够调整Kinect的俯仰角度。俯仰角度可以通过更改KinectSensor对象的 ElevationAnagle属性来进行调整。如果应用程序对于游戏者脚部动作比较关注，那么通过程序调整Kinect的俯仰角能够决绝脚部超出视场下界的情况。

ElevationAnagle以度为单位。KinectSensor的MaxElevationAngle和MinElevationAngle确定了可以调整角度的上下界。任何将ElevationAngle设置超出上下界的操作将会掏出ArgumentOutOfRangeExcepthion异常。微软建议不要过于频繁重复的调整俯仰角以免损坏马达。为了使得开发这少犯错误和保护马达，SDK限制了每秒能调整的俯仰角的值。SDK限制了在连续 15次调整之后要暂停20秒。

Joints

每一个骨骼对象都有一个Joints字段。该字段是一个JointsCollection类型，它存储了一些列的Joint结构来描述骨骼中可追踪的关节点(如head,hands,elbow等等)。应用程序使用JointsCollection索引获取特定的关节点，并通过节点的 JointType枚举来过滤指定的关节点。即使Kinect视场中没有游戏者Joints对象也被填充。

2.4 Joint

骨骼追踪引擎能够跟踪和获取每个用户的近20个点或者关节点信息。追踪的数据以关节点数据展现，它有三个属性。JointType属性是一个枚举类型。下图描述了可追踪的所有关节点。

每一个关节点都有类型为SkeletonPoint的Position属性，他通过X,Y,Z三个值来描述关节点的控件位置。X,Y值是相对于骨骼平面空间的位置，他和深度影像，彩色影像的空间坐标系不一样。KinectSnesor对象有一些列的坐标转换方法，可以将骨骼坐标点转换到对应的深度数据影像中去。最后每一个Skeleton对象还有一个JointTrackingState属性，他描述了该关节点的跟踪状态及方式，下面列出了所有的可能值。

3. 结语

本文首先通过一个例子展示骨骼追踪系统所涉及的主要对象，并将骨骼数据在UI界面上进行了绘制，在此基础上详细介绍了骨骼追踪对象模型中涉及到的主要对象，方法和属性。SDK中骨骼追踪占了大概三分之一的内容，所以熟悉这些对象对于开发基于Kinect应用程序至关重要。限于篇幅，下一篇文章将会演示一个使用Kinect骨骼追踪系统开发的小游戏，然后讨论控件坐标变换，敬请期待。

本文代码点击此处下载，希望以上内容对您熟悉Kinect SDK有所帮助！

[转载][译]Kinect for Windows SDK开发入门(五)：景深数据处理下 - yangecnu - 博客园

2015-12-11mikel阅读(929)

来源： [转载][译]Kinect for Windows SDK开发入门(五)：景深数据处理下 – yangecnu – 博客园

1. 简单的景深影像处理

在上篇文章中，我们讨论了如何获取像素点的深度值以及如何根据深度值产生影像。在之前的例子中，我们过滤掉了阈值之外的点。这就是一种简单的图像处理，叫阈值处理。使用的阈值方法虽然有点粗糙，但是有用。更好的方法是利用机器学习来从每一帧影像数据中计算出阈值。Kinect深度值最大为4096mm，0 值通常表示深度值不能确定，一般应该将0值过滤掉。微软建议在开发中使用1220mm（4’）~3810mm(12.5’)范围内的值。在进行其他深度图像处理之前，应该使用阈值方法过滤深度数据至1220mm-3810mm这一范围内。

使用统计方法来处理深度影像数据是一个很常用的方法。阈值可以基于深度数据的平均值或者中值来确定。统计方法可以帮助确定某一点是否是噪声、阴影或者是其他比较有意义的物体，比如说用户的手的一部分。有时候如果不考虑像素的视觉意义，可以对原始深度进行数据挖掘。对景深数据处理的目的是进行形状或者物体的识别。通过这些信息，程序可以确定人体相对于Kinect的位置及动作。

1.1深度影像数据直方图

直方图是统计数据分布的一个很有效的工具。在这里我们关心的是一个景深影像图中深度值的分布。直方图能够直观地反映给定数据集中数据的分布状况。从直方图中，我们能够看出深度值出现的频率以及聚集分组。通过这些信息，我们能够确定阈值以及其他能够用来对图像进行过滤的指标，使得能够最大化的揭示深度影像图中的深度信息。为了展示这一点，接下来我们将会展示一副景深影像数据的直方图，并通过直方图，使用一些简单的技术来过滤掉我们不想要的像素点。

首先创建一个新的项目。然后根据之前文章中讲的步骤发现和初始化KinectSensor对象来进行深度影像数据处理，包括注册DepthFrameReady事件。在添加实现深度直方图之前，将UI界面更改为如下：

<Window x:Class="KinectDepthHistogram.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="MainWindow" Height="800" Width="1200" WindowStartupLocation="CenterScreen">
    <Grid>
        <StackPanel>
            <StackPanel Orientation="Horizontal">
                <Image x:Name="DepthImage" Width="640" Height="480" />
                <Image x:Name="FilteredDepthImage" Width="640" Height="480" />
            </StackPanel>
            <ScrollViewer Margin="0,15" HorizontalScrollBarVisibility="Auto" VerticalScrollBarVisibility="Auto">
                <StackPanel x:Name="DepthHistogram" Orientation="Horizontal" Height="300" />
            </ScrollViewer>
        </StackPanel>
    </Grid>
</Window>

创建直方图的方法很简单，就是创建一系列的矩形元素，然后将它添加到名为DepthHistogram的StackPanel元素中，由于 DepthHistogram对象的Orientation属性设置为Horizontal,所以这些矩形会水平排列。大多数应用程序计算直方图只是用来进行中间过程处理用，如果想要将直方图展现出来，则需要在绘图上面做些工作。下面的代码展现了如何绘制直方图：

private void KinectDevice_DepthFrameReady(object sender, DepthImageFrameReadyEventArgs e)
{
    using (DepthImageFrame frame = e.OpenDepthImageFrame())
    {
        if (frame != null)
        {
            frame.CopyPixelDataTo(this._DepthPixelData);
            CreateBetterShadesOfGray(frame, this._DepthPixelData);
            CreateDepthHistogram(frame, this._DepthPixelData);
        }
    }
}

private void CreateDepthHistogram(DepthImageFrame depthFrame, short[] pixelData)
{
    int depth;
    int[] depths = new int[4096];
    double chartBarWidth = Math.Max(3, DepthHistogram.ActualWidth / depths.Length);
    int maxValue = 0;


    DepthHistogram.Children.Clear();


    //计算并获取深度值.并统计每一个深度值出现的次数
    for (int i = 0; i < pixelData.Length; i++)
    {
        depth = pixelData[i] >> DepthImageFrame.PlayerIndexBitmaskWidth;

        if (depth >= LoDepthThreshold && depth <= HiDepthThreshold)
        {
            depths[depth]++;
        }
    }


    //查找最大的深度值
    for (int i = 0; i < depths.Length; i++)
    {
        maxValue = Math.Max(maxValue, depths[i]);
    }


    //绘制直方图
    for (int i = 0; i < depths.Length; i++)
    {
        if (depths[i] > 0)
        {
            Rectangle r = new Rectangle();
            r.Fill = Brushes.Black;
            r.Width = chartBarWidth;
            r.Height = DepthHistogram.ActualHeight * (depths[i] / (double)maxValue);
            r.Margin = new Thickness(1, 0, 1, 0);
            r.VerticalAlignment = System.Windows.VerticalAlignment.Bottom;
            DepthHistogram.Children.Add(r);
        }
    }
}

绘制直方图时，创建一个数组来存储所有可能的深度值数据，因此数组的大小为4096。第一步遍历深度图像，获取深度值，然后统计深度值出现的次数。因为设置了最高最低的距离阈值，忽略了0值。下图显示了深度值影像的直方图，X轴表示深度值，Y轴表示深度值在图像中出现的次数。

当站在Kinect前后晃动时，下面的直方图会不停的变化。图中后面最长的几个线条表示墙壁，大约离摄像头3米左右，前面的几个小的线条是人体，大概离摄像头2米左右，下面那副图中，我手上拿了一个靠垫，可以发现直方图与之前的直方图相比发生了一些变化。

这两幅图中，可以看到直方图都集中在两个地方，前面的一小撮和后面的那一大坨。所以根据直方图可以看出，前面那个表示人体，后面那个代表房间的墙壁，在结合一些图像处理技术，就大致可以把人体和背景区分开来了。

1.2 一些图像处理相关的知识

本文不打算详细讲解图像处理的相关知识。只是讨论如何获取原始的深度数据，以及理解数据的用途。很多情况下，基于Kinect的应用程序不会对深度数据进行很多处理。如果要处理数据，也应该使用一些类库诸如OpenCV库来处理这些数据。深度影像处理经常要耗费大量计算资源，不应该使用诸如C#这类的高级语言来进行影像处理。

Note： OpenCV(Open Source Computer Vision)库是是一个经常用来处理和计算影像数据的算法类库。这个类库也包含点云库(Point Cloud Library, PCL) 和机器人操作系统(Robot Operating System, ROS)，这些都涉及到了大量的深度数据处理。有兴趣的可以研究一下OpenCV库。

应用程序处理深度数据目的是用来确定人体在Kinect视场中的位置。虽然Kinect SDK中的骨骼追踪在这方面功能更强大，但是在某些情况下还是需要从深度数据中分析出人物所处的位置。在下节中，我们将会分析人体在深度影像中的范围。在开始之前，有必要了解和研究一下图像处理中常用的一些算法，有时候这些对特征提取非常有帮助。

图像处理

阈值处理(Thresholding)

图像分割 (Segmentation)

边缘/轮廓探测 (Edge/Contour Detection)

高斯滤波(Gaussian filter)

Sobel、Prewitt、Kirsh算子

Canny算子

罗伯特算子

2. 深度数据和游戏者索引位

Kinect SDK具有分析景深数据和探测人体或者游戏者轮廓的功能，它一次能够识别多达6个游戏者。SDK为每一个追踪到的游戏者编号作为索引。游戏者索引存储在深度数据的前3个位中。如前一篇文章讨论的，景深数据每一个像素占16位，0-2位存储游戏者索引值，3-15为存储深度值。7 (0000 0111)这个位掩码能够帮助我们从深度数据中获取到游戏者索引值。幸运的是，SDK为游戏者索引位定义了一些列常量。他们是 DepthImageFrame.PlayerIndexBitmaskWidth和 DepthImageFrame.PlayerIndexBitmask。前一个值是3，后一个是7。开发者应该使用SDK定义的常量而不应该硬编码3或者7。

游戏者索引位取值范围为0~6，值为0表示该像素不是游戏者。但是初始化了景深数据流并没有开启游戏者追踪。游戏者追踪需要依赖骨骼追踪技术。初始化 KinectSensor对象和DepthImageStream对象时，需要同时初始化SkeletonStream对象。只有当 SkeletonStream对象初始化了后，景深数据中才会有游戏者索引信息。获取游戏者索引信息并不需要注册SkeletonFrameReady事件。

再创建一个工程来展示如何获取游戏者索引位信息。首先，创建一个新的项目，初始化KinectSensor对象，初始化DepthImageStream 和SkeletonStream对象，并注册KinectSensor的DepthFrameReady事件。在UI界面 MainWindows.xaml中添加两个Image控件分别取名为RamDepthImage和EnhDepthImage。添加 WirteableBitmap对象，代码如下:

<Window x:Class="KinectDepthImagePlayerIndex.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="Kinect Player Index" Height="600" Width="1200">
    <Grid>
        <StackPanel Orientation="Horizontal">
            <Image x:Name="RawDepthImage" Margin="0,0,10,0" Width="640" Height="480"/>
            <Image x:Name="EnhDepthImage" Width="640" Height="480"/>
        </StackPanel>
    </Grid>
</Window>

下面的代码将有游戏者索引位的数据显示为黑色，其他像元显示为白色。

private void KinectDevice_DepthFrameReady(object sender, DepthImageFrameReadyEventArgs e)
{
    using (DepthImageFrame frame = e.OpenDepthImageFrame())
    {
        if (frame != null)
        {
            frame.CopyPixelDataTo(this._RawDepthPixelData);
            this._RawDepthImage.WritePixels(this._RawDepthImageRect, this._RawDepthPixelData, this._RawDepthImageStride, 0);
            CreatePlayerDepthImage(frame, this._RawDepthPixelData);
        }
    }
}


private void CreatePlayerDepthImage(DepthImageFrame depthFrame, short[] pixelData)
{
    int playerIndex;
    int depthBytePerPixel = 4;
    byte[] enhPixelData = new byte[depthFrame.Width * depthFrame.Height * depthBytePerPixel];

    for (int i = 0, j = 0; i < pixelData.Length; i++, j += depthBytePerPixel)
    {
        playerIndex = pixelData[i] & DepthImageFrame.PlayerIndexBitmask;

        if (playerIndex == 0)
        {
            enhPixelData[j] = 0xFF;
            enhPixelData[j + 1] = 0xFF;
            enhPixelData[j + 2] = 0xFF;
        }
        else
        {
            enhPixelData[j] = 0x00;
            enhPixelData[j + 1] = 0x00;
            enhPixelData[j + 2] = 0x00;
        }
    }


    this._EnhDepthImage.WritePixels(this._EnhDepthImageRect, enhPixelData, this._EnhDepthImageStride, 0);
}

运行后，效果如下图，还可以对上面的代码进行一些改进。例如，可以对游戏者所在的像素进行灰度值拉伸，能够绘制出游戏者深度值的直方图，根据直方图可以看出每一灰度级对应的频率。另一个改进是，可以对不同的游戏者给予不同的颜色显示，比如游戏者1用红色表示，游戏者2用蓝色表示等等。

要注意的是，不要对特定的游戏者索引位进行编码，因为他们是会变化的。实际的游戏者索引位并不总是和Kinect前面的游戏者编号一致。例如， Kinect视野中只有一个游戏者，但是返回的游戏者索引位值可能是3或者4。有时候第一个游戏者的游戏者索引位可能不是1，比如走进Kinect视野，返回的索引位是1，走出去后再次走进，可能索引位变为其他值了。所以开发Kinect应用程序的时候应该注意到这一点。

3. 对物体进行测量

像上篇文章中对深度值测量原理进行讨论的那样，像素点的X，Y位置和实际的宽度和高度并不一致。但是运用几何知识，通过他们对物体进行测量是可能的。每一个摄像机都有视场，焦距的长度和相机传感器的大小决定了视场角。Kinect中相机的水平和垂直视场角分别为57°和43°。既然我们知道了深度值，利用三角几何知识，就可以计算出物体的实际宽度。示意图如下：

图中的公式在某些情况下可能不准确，Kinect返回的数据也有这个问题。这个简化的公式并没有考虑到游戏者的其他部分。尽管如此，公式依然能满足大部分的应用。这里只是简单地介绍了如何将Kinect数据映射到真实环境中。如果想得到更好的精度，则需要研究Kinect摄像头的焦距和摄像头的尺寸。

在开始写代码前，先看看上图中的公式。摄像头的视场角是一个以人体深度位置为底的一个等腰三角形。人体的实际深度值是这个等腰三角形的高。可以将这个等腰三角形以人所在的位置分为两个直角三角形，这样就可以计算出底边的长度。一旦知道了底边的长度，我们就可以将像素的宽度转换为现实中的宽度。例如：如果我们计算出等腰三角形底边的宽度为1500mm，游戏者所占有的总象元的宽度为100，深度影像数据的总象元宽度为320。那么游戏者实际的宽度为 468.75mm((1500/320)*100)。公式中，我们需要知道游戏者的深度值和游戏者占用的总的象元宽度。我们可以将游戏者所在的象元的深度值取平均值作为游戏者的深度值。之所以求平均值是因为人体不是平的，这能够简化计算。计算人物高度也是类似的原理，只不过使用的垂直视场角和深度影像的高度。

知道了原理之后，就可以开始动手写代码实现了。先创建一个新的项目然后编写发现和初始化KinectSensor的代码，将DepthStream和 SkeletonStream均初始化，然后注册KinectSnsor的DepthFrameReady事件。主UI界面中的代码如下：

<Window x:Class="KinectTakingMeasure.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="MainWindow" Height="800" Width="1200" WindowStartupLocation="CenterScreen">
    <Grid>
        <StackPanel Orientation="Horizontal">
            <Image x:Name="DepthImage" />
            <ItemsControl x:Name="PlayerDepthData" Width="300" TextElement.FontSize="20">
                <ItemsControl.ItemTemplate>
                    <DataTemplate>
                        <StackPanel Margin="0,15">
                            <StackPanel Orientation="Horizontal">
                                <TextBlock Text="PlayerId:" />
                                <TextBlock Text="{Binding Path=PlayerId}" />
                            </StackPanel>
                            <StackPanel Orientation="Horizontal">
                                <TextBlock Text="Width:" />
                                <TextBlock Text="{Binding Path=RealWidth}" />
                            </StackPanel>
                            <StackPanel Orientation="Horizontal">
                                <TextBlock Text="Height:" />
                                <TextBlock Text="{Binding Path=RealHeight}" />
                            </StackPanel>
                        </StackPanel>
                    </DataTemplate>
                </ItemsControl.ItemTemplate>
            </ItemsControl>
        </StackPanel>
    </Grid>
</Window>

使用ItemControl的目的是用来显示结果。方法创建了一个对象来存放用户的深度数据以及计算得到的实际宽度和高度值。程序创建了一个这样的对象数组。他是ItemControl的ItemsSource值。UI定义了一个模板用来展示和游戏者深度值相关的数据，这个模板使用的对象取名为 PlayerDepthData。下面的名为ClaculatePlayerSize的方法将作为DepthFrameReady事件发生时执行的操作。

private void KinectDevice_DepthFrameReady(object sender, DepthImageFrameReadyEventArgs e)
{
    using (DepthImageFrame frame = e.OpenDepthImageFrame())
    {
        if (frame != null)
        {
            frame.CopyPixelDataTo(this._DepthPixelData);
            CreateBetterShadesOfGray(frame, this._DepthPixelData);
            CalculatePlayerSize(frame, this._DepthPixelData);
        }
    }
}


private void CalculatePlayerSize(DepthImageFrame depthFrame, short[] pixelData)
{
    int depth;
    int playerIndex;
    int pixelIndex;
    int bytesPerPixel = depthFrame.BytesPerPixel;
    PlayerDepthData[] players = new PlayerDepthData[6];

    for (int row = 0; row < depthFrame.Height; row++)
    {
        for (int col = 0; col < depthFrame.Width; col++)
        {
            pixelIndex = col + (row * depthFrame.Width);
            depth = pixelData[pixelIndex] >> DepthImageFrame.PlayerIndexBitmaskWidth;

            if (depth != 0)
            {
                playerIndex = (pixelData[pixelIndex] & DepthImageFrame.PlayerIndexBitmask) - 1;

                if (playerIndex > -1)
                {
                    if (players[playerIndex] == null)
                    {
                        players[playerIndex] = new PlayerDepthData(playerIndex + 1, depthFrame.Width, depthFrame.Height);
                    }

                    players[playerIndex].UpdateData(col, row, depth);
                }
            }
        }
    }

    PlayerDepthData.ItemsSource = players;
}

粗体部分代码中使用了PlayerDepthData对象。CalculatePlayerSize方法遍历深度图像中的象元，然后提取游戏者索引位及其对应的深度值。算法忽略了所有深度值为0的象元以及游戏者之外的象元。对于游戏者的每一个象元，方法调用PlayerDepthData对象的 UpdateData方法。处理完所有象元之后，将游戏者数组复制给名为PlayerDepthData的ItemControl对象的数据源。对游戏者宽度高度的计算封装在PlayerDepthData这一对象中。

PlayerDepthData对象的代码如下：

class PlayerDepthData
{
    #region Member Variables
    private const double MillimetersPerInch = 0.0393700787;
    private static readonly double HorizontalTanA = Math.Tan(57.0 / 2.0 * Math.PI / 180);
    private static readonly double VerticalTanA = Math.Abs(Math.Tan(43.0 / 2.0 * Math.PI / 180));

    private int _DepthSum;
    private int _DepthCount;
    private int _LoWidth;
    private int _HiWidth;
    private int _LoHeight;
    private int _HiHeight;
    #endregion Member Variables


    #region Constructor
    public PlayerDepthData(int playerId, double frameWidth, double frameHeight)
    {
        this.PlayerId = playerId;
        this.FrameWidth = frameWidth;
        this.FrameHeight = frameHeight;

        this._LoWidth = int.MaxValue;
        this._HiWidth = int.MinValue;

        this._LoHeight = int.MaxValue;
        this._HiHeight = int.MinValue;
    }
    #endregion Constructor


    #region Methods
    public void UpdateData(int x, int y, int depth)
    {
        this._DepthCount++;
        this._DepthSum += depth;
        this._LoWidth = Math.Min(this._LoWidth, x);
        this._HiWidth = Math.Max(this._HiWidth, x);
        this._LoHeight = Math.Min(this._LoHeight, y);
        this._HiHeight = Math.Max(this._HiHeight, y);
    }
    #endregion Methods


    #region Properties
    public int PlayerId { get; private set; }
    public double FrameWidth { get; private set; }
    public double FrameHeight { get; private set; }


    public double Depth
    {
        get { return this._DepthSum / (double)this._DepthCount; }
    }


    public int PixelWidth
    {
        get { return this._HiWidth - this._LoWidth; }
    }


    public int PixelHeight
    {
        get { return this._HiHeight - this._LoHeight; }
    }


    public string RealWidth
    {
        get
        {
            double inches = this.RealWidthInches;
return string.Format("{0:0.0}mm", inches * 25.4);
}
    }


    public string RealHeight
    {
        get
        {
            double inches = this.RealHeightInches;
return string.Format("{0:0.0}mm", inches * 25.4);
}
    }


    public double RealWidthInches
    {
        get
        {
            double opposite = this.Depth * HorizontalTanA;
            return this.PixelWidth * 2 * opposite / this.FrameWidth * MillimetersPerInch;
        }
    }

    public double RealHeightInches
    {
        get
        {
            double opposite = this.Depth * VerticalTanA;
            return this.PixelHeight * 2 * opposite / this.FrameHeight * MillimetersPerInch;
        }
    }
    #endregion Properties
}

单独编写PlayerDepthData这个类的原因是封装计算逻辑。这个类有两个输入点和两个输出点。构造函数以及UpdateData方法是两个输入点。ReadlWith和RealHeight两个属性是两个输出点。这两个属性是基于上图中的公式计算得出的。公式使用平均深度值，深度数据帧的宽度和高度，和游戏者总共所占有的象元。平均深度值和所有的象元是通过参数传入到UpdateData方法中然后计算的出来的。真实的宽度和高度值是基于 UpdateData方法提供的数据计算出来的。下面是我做的6个动作的不同截图，右边可以看到测量值，手上拿了键盘用来截图。

以上测量结果只是以KinectSensor能看到的部分来进行计算的。拿上图1来说。显示的高度是1563mm，宽度为622mm。这里高度存在偏差，实际高度应该是1665左右，可能是脚部和头部测量有误差。以上代码可以同时测量6个游戏者，但是由于只有我一个人，所以做了6个不同的动作，截了6次图。还可以看到一点的是，如上面所讨论的，当只有一个游戏者时，游戏者索引值不一定是从1开始，从上面6幅图可以看出，进出视野会导致游戏者索引值发生变化，值是不确定的。

4.深度值图像和视频图像的叠加

在之前的例子中，我们将游戏者所属的象元用黑色显示出来，而其他的用白色显示，这样就达到了提取人物的目的。我们也可以将人物所属的象元用彩色表示，而将其他部分用白色表示。但是，有时候我们想用深度数据中游戏者所属的象元获取对应的彩色影像数据并叠加到视频图像中。这在电视制作和电影制作中很常见，这种技术叫做绿屏抠像，就是演员或者播音员站在绿色底板前，然后录完节目后，绿色背景抠出，换成其他场景，在一些科幻电影中演员不可能在实景中表演时常采用的造景手法。我们平常照证件照时，背景通常是蓝色或者红色，这样也是便于选取背景颜色方便抠图的缘故。在Kinect中我们也可以达到类似的效果。 Kinect SDK使得这个很容易实现。

Note:这是现实增强的一个基本例子，现实增应用非常有趣而且能够获得非常好的用于体验。许多艺术家使用Kinect来进行现实增强交互时展览。另外，这种技术也通常作为广告和营销的工具。

前面的例子中，我们能够判断哪个像素是否有游戏者。但是这个只能对于景深数据使用。不幸的是，景深数据影像的象元不能转换到彩色影像中去，即使两者使用相同的分辨率。因为这两个摄像机位于Kinect上的不同位置，所以产生的影像不能够叠加到一起。就像人的两只眼睛一样，当你只睁开左眼看到的景象和只睁开右眼看到的景象是不一样的，人脑将这两只眼睛看到的景物融合成一幅合成的景象。

幸运的是，Kinect SDK提供了一些方法来方便我们进行这些转换，这些方法位于KinectSensor对象中，他们是 MapDepthToColorImagePoint，MapDepthToSkeletonPoint，MapSkeletonPointToColor 和MapSkeletonPointToDepth。在DepthImageFrame对象中这些方法的名字有点不同 (MapFromSkeletonPoint,MapToColorImagePoint及MapToSkeletonPoint)，但功能是相似的。在下面的例子中，我们使用MapDepthToColorImagePoint方法来将景深影像中游戏者所属的象元转换到对应的彩色影像中去。细心的读者可能会发现，没有一个方法能够将彩色影像中的象元转换到对应的景深影像中去。

创建一个新的工程，添加两个Image对象。第一个Image是背景图片。第二个Image是前景图像。在这个例子中，为了使景深影像和彩色影像尽可能的接近，我们采用轮询的方式。每一个影像都有一个Timestamp对象，我们通过比较数据帧的这个值来确定他们是否足够近。注册KinectSensor 对象的AllFrameReady事件，并不能保证不同数据流产生的数据帧时同步的。这些帧不可能同时产生，但是轮询模式能够使得不同数据源产生的帧能够尽可能的够近。下面的代码展现了实现方式:

private KinectSensor _KinectDevice;
private WriteableBitmap _GreenScreenImage;
private Int32Rect _GreenScreenImageRect;
private int _GreenScreenImageStride;
private short[] _DepthPixelData;
private byte[] _ColorPixelData;
private bool _DoUsePolling;

private void CompositionTarget_Rendering(object sender, EventArgs e)
{
    DiscoverKinect();
    if (this.KinectDevice != null)
    {
        try
        {
            using (ColorImageFrame colorFrame = this.KinectDevice.ColorStream.OpenNextFrame(100))
            {
                using (DepthImageFrame depthFrame = this.KinectDevice.DepthStream.OpenNextFrame(100))
                {
                    RenderGreenScreen(this.KinectDevice, colorFrame, depthFrame);
                }
            }
        }
        catch (Exception)
        {
            //Do nothing, because the likely result is that the Kinect has been unplugged.     
        }
    }
}


private void DiscoverKinect()
{
    if (this._KinectDevice != null && this._KinectDevice.Status != KinectStatus.Connected)
    {
        UninitializeKinectSensor(this._KinectDevice);
        this._KinectDevice = null;
    }


    if (this._KinectDevice == null)
    {
        this._KinectDevice = KinectSensor.KinectSensors.FirstOrDefault(x => x.Status == KinectStatus.Connected);


        if (this._KinectDevice != null)
        {
            InitializeKinectSensor(this._KinectDevice);
        }
    }
}


private void InitializeKinectSensor(KinectSensor sensor)
{
    if (sensor != null)
    {
        sensor.DepthStream.Range = DepthRange.Default;

        sensor.SkeletonStream.Enable();
        sensor.DepthStream.Enable(DepthImageFormat.Resolution640x480Fps30);
        sensor.ColorStream.Enable(ColorImageFormat.RgbResolution1280x960Fps12);

        DepthImageStream depthStream = sensor.DepthStream;
        this._GreenScreenImage = new WriteableBitmap(depthStream.FrameWidth, depthStream.FrameHeight, 96, 96, PixelFormats.Bgra32, null);
        this._GreenScreenImageRect = new Int32Rect(0, 0, (int)Math.Ceiling(this._GreenScreenImage.Width), (int)Math.Ceiling(this._GreenScreenImage.Height));
        this._GreenScreenImageStride = depthStream.FrameWidth * 4;
        this.GreenScreenImage.Source = this._GreenScreenImage;

        this._DepthPixelData = new short[this._KinectDevice.DepthStream.FramePixelDataLength];
        this._ColorPixelData = new byte[this._KinectDevice.ColorStream.FramePixelDataLength];

        if (!this._DoUsePolling)
        {
            sensor.AllFramesReady += KinectDevice_AllFramesReady;
        }

        sensor.Start();
    }
}

private void UninitializeKinectSensor(KinectSensor sensor)
{
    if (sensor != null)
    {
        sensor.Stop();
        sensor.ColorStream.Disable();
        sensor.DepthStream.Disable();
        sensor.SkeletonStream.Disable();
        sensor.AllFramesReady -= KinectDevice_AllFramesReady;
    }
}

以上代码有三个地方加粗。第一地方引用了RenderGreenScreen方法。第二个和第三个地方我们初始化了彩色和景深数据流。当在两个图像之间转换时，将彩色图形的分辨率设成景深数据的两倍能够得到最好的转换效果。

RenderGreenScreen方法中执行实际的转换操作。首先通过移除没有游戏者的象元创建一个新的彩色影像。算法遍历景深数据的每一个象元，然后判断游戏者索引是否有有效值。然后获取景深数据中游戏者所属象元对应的彩色图像上的象元，将获取到的象元存放在象元数组中。代码如下：

private void RenderGreenScreen(KinectSensor kinectDevice, ColorImageFrame colorFrame, DepthImageFrame depthFrame)
{
  if (kinectDevice != null && depthFrame != null && colorFrame != null)
  {
    int depthPixelIndex;
    int playerIndex;
    int colorPixelIndex;
    ColorImagePoint colorPoint;
    int colorStride = colorFrame.BytesPerPixel * colorFrame.Width;
    int bytesPerPixel = 4;
    byte[] playerImage = new byte[depthFrame.Height * this._GreenScreenImageStride];
    int playerImageIndex = 0;

    depthFrame.CopyPixelDataTo(this._DepthPixelData);
    colorFrame.CopyPixelDataTo(this._ColorPixelData);

    for (int depthY = 0; depthY < depthFrame.Height; depthY++)
    {
      for (int depthX = 0; depthX < depthFrame.Width; depthX++, playerImageIndex += bytesPerPixel)
      {
        depthPixelIndex = depthX + (depthY * depthFrame.Width);
        playerIndex = this._DepthPixelData[depthPixelIndex] & DepthImageFrame.PlayerIndexBitmask;

        if (playerIndex != 0)
        {
          colorPoint = kinectDevice.MapDepthToColorImagePoint(depthFrame.Format, depthX, depthY, this._DepthPixelData[depthPixelIndex], colorFrame.Format);
          colorPixelIndex = (colorPoint.X * colorFrame.BytesPerPixel) + (colorPoint.Y * colorStride);

           playerImage[playerImageIndex] = this._ColorPixelData[colorPixelIndex];         //Blue    
           playerImage[playerImageIndex + 1] = this._ColorPixelData[colorPixelIndex + 1];     //Green
           playerImage[playerImageIndex + 2] = this._ColorPixelData[colorPixelIndex + 2];     //Red
           playerImage[playerImageIndex + 3] = 0xFF;                                          //Alpha
          }
        }
      }

     this._GreenScreenImage.WritePixels(this._GreenScreenImageRect, playerImage, this._GreenScreenImageStride, 0);
    }
}

PlayerImage位数组存储了所有属于游戏者的彩色影像象元。从景深数据对应位置获取到的彩色影像象元的大小和景深数据象元大小一致。与景深数据每一个象元占两个字节不同。彩色影像数据每个象元占4个字节，蓝绿红以及Alpha值各占一个字节，在本例中Alpha值很重要，它用来确定每个象元的透明度，游戏者所拥有的象元透明度设置为255(0xFF)不透明而其他物体则设置为0，表示透明。

MapDepthToColorImagePoint方法接受景深象元位置以及深度值，返回对应的对应彩色影像中象元的位置。剩下的代码获取游戏者在彩色影像中的象元并将其存储到PlayerImage数组中。当处理完所有的景深数据象元后，代码更新Image的数据源。运行程序后，需要站立一段时间后人物才能够显示出来，如果移动太快，可能出来不了，因为景深数据和彩色数据不能够对齐，可以看到任务轮廓有一些锯齿和噪声，但要处理这些问题还是有点麻烦的，它需要对象元进行平滑。要想获得最好的效果，可以将多帧彩色影像合称为一帧。运行程序后结果如下图，端了个键盘，人有点挫：

5.结语

本文首先介绍了关于景深数据的简单图像数据，包括景深数据的直方图显示以及一些图像处理相关的算法，然后介绍了景深数据中的游戏者索引位，借助索引位，我们实现了人物宽度和高度的计算，最后借助景深数据结合彩色影像数据，将景深影像和视频图像进行了叠加。

至此，景深数据处理介绍完了，后面将会开始介绍Kinect的骨骼追踪技术，敬请期待。

点击此处下载本文所有代码，希望对您了解Kinect SDK有所帮助！

[转载][译]Kinect for Windows SDK开发入门(四)：景深数据处理上 - yangecnu - 博客园

2015-12-11mikel阅读(1039)

来源： [转载][译]Kinect for Windows SDK开发入门(四)：景深数据处理上 – yangecnu – 博客园

Kinect传感器的最主要功能之一就是能够产生三维数据，通过这些数据我们能够创建一些很酷的应用。开发Kinect应用程序之前，最好能够了解 Kinect的硬件结构。Kinect红外传感器能够探测人体以及非人体对象例如椅子或者咖啡杯。有很多商业组织和实验室正在研究使用景深数据来探测物体。

本文详细介绍了Kinect红外传感器，景深数据格式，景深图像的获取与展示，景深图像的增强处理。

1. Kinect传感器

和许多输入设备不一样，Kinect能够产生三维数据，它有红外发射器和摄像头。和其他Kinect SDK如OpenNI或者libfreenect等SDK不同，微软的Kinect SDK没有提供获取原始红外数据流的方法，相反，Kinect SDK从红外摄像头获取的红外数据后，对其进行计算处理，然后产生景深影像数据。景深影像数据从DepthImageFrame产生，它由 DepthImageStream对象提供。

DepthImageStream的使用和ColorImageStream的使用类似。DepthImageStream和 ColorImageStream都继承自ImageStream。可以像从ColorImageStream获取数据生成图像那样生成景深图像。先看看将景深数据展现出来需要的步骤。下面的步骤和前面显示彩色影像数据相似：

1. 创建一个新的WPF对象。

2. 添加Microsoft.Kinect.dll对象引用。

3. 添加一个Image元素到UI上，将名称改为DepthImage。

4. 添加必要的发现和释放KinectSensor对象的代码。可以参照前面的文章。

5. 修改初始化KinectSensor对象的代码如下：

private void InitializeKinectSensor(KinectSensor kinectSensor)
{
    if (kinectSensor != null)
    {
        DepthImageStream depthStream = kinectSensor.DepthStream;
        depthStream.Enable();

        depthImageBitMap = new WriteableBitmap(depthStream.FrameWidth, depthStream.FrameHeight,  96,96,PixelFormats.Gray16, null);
        depthImageBitmapRect = new Int32Rect(0, 0, depthStream.FrameWidth, depthStream.FrameHeight);
        depthImageStride = depthStream.FrameWidth * depthStream.FrameBytesPerPixel;

        DepthImage.Source = depthImageBitMap;
        kinectSensor.DepthFrameReady += kinectSensor_DepthFrameReady;
        kinectSensor.Start();
    }
}

6. 修改DepthFrameReady事件，代码如下：

void kinectSensor_DepthFrameReady(object sender, DepthImageFrameReadyEventArgs e)
{
    using (DepthImageFrame depthFrame = e.OpenDepthImageFrame())
    {
        if (depthFrame != null)
        {
            short[] depthPixelDate = new short[depthFrame.PixelDataLength];
            depthFrame.CopyPixelDataTo(depthPixelDate);
            depthImageBitMap.WritePixels(depthImageBitmapRect, depthPixelDate, depthImageStride, 0);
        }
    }
}

运行程序，将会看到如下结果，由于一手需要截图，一手需要站在Kinect前面所以姿势不是很对，有点挫，不过人物的轮廓还是显示出来了，在景深数据中，离Kinect越近，颜色越深，越远，颜色越淡。

2. Kinect 深度测量原理

和其他摄像机一样，近红外摄像机也有视场。Kinect摄像机的视野是有限的，如下图所示：

如图，红外摄像机的视场是金字塔形状的。离摄像机远的物体比近的物体拥有更大的视场横截面积。这意味着影像的高度和宽度，比如640X480和摄像机视场的物理位置并不一一对应。但是每个像素的深度值是和视场中物体离摄像机的距离是对应的。深度帧数据中，每个像素占16位，这样BytesPerPixel 属性，即每一个像素占2个字节。每一个像素的深度值只占用了16个位中的13个位。如下图：

获取每一个像素的距离很容易，但是要直接使用还需要做一些位操作。可能大家在实际编程中很少情况会用到位运算。如上图所示，深度值存储在第3至15位中，要获取能够直接使用的深度数据需要向右移位，将游戏者索引(Player Index)位移除。后面将会介绍游戏者索引位的重要性。下面的代码简要描述了如何获取像素的深度值。代码中pixelData变量就是从深度帧数据中获取的short数组。PixelIndex基于待计算像素的位置就算出来的。SDK在DepthImageFrame类中定义了一个常量 PlayerIndexBitmaskWidth，它定义了要获取深度数据值需要向右移动的位数。在编写代码时应该使用这一常量而不是硬编码，因为未来随着软硬件水平的提高，Kinect可能会增加能够同时识别人数的个数，从而改变PlayerIndexBitmaskWidth常量的值。

Int32 pixelIndex = (Int32)(p.X + ((Int32)p.Y * frame.Width));
Int32 depth = this.depthPixelDate[pixelIndex] >> DepthImageFrame.PlayerIndexBitmaskWidth;

显示深度数据最简单的方式是将其打印出来。我们要将像素的深度值显示到界面上，当鼠标点击时，显示鼠标点击的位置的像素的深度值。第一步是在主UI界面上添加一个TextBlock：

<Window x:Class="KinectDepthImageDemo.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="KinectDepthImage" Height="600" Width="1280" WindowStartupLocation="CenterScreen">
    <Grid>
        <StackPanel Orientation="Horizontal">
            <TextBlock x:Name="PixelDepth" FontSize="48" HorizontalAlignment="Left"  />
            <Image x:Name="DepthImage"  Width="640" Height="480" ></Image>
        </StackPanel>
    </Grid>
</Window>

接着我们要处理鼠标点击事件。在添加该事件前，需要首先添加一个私有变量lastDepthFrame来保存每一次DepthFrameReady事件触发时获取到的DepthFrame值。因为我们保存了对最后一个DepthFrame对象的引用，所以事件处理代码不会马上释放该对象。然后，注册 DepthFrame 图像控件的MouseLeftButtonUp事件。当用户点击深度图像时,DepthImage_MouseLeftButtonUp事件就会触发，根据鼠标位置获取正确的像素。最后一步将获取到的像素值的深度值显示到界面上，代码如下：

void kinectSensor_DepthFrameReady(object sender, DepthImageFrameReadyEventArgs e)
{
   if (lastDepthFrame!=null)
   {
       lastDepthFrame.Dispose();
       lastDepthFrame = null;
   }
    lastDepthFrame = e.OpenDepthImageFrame();
    if (lastDepthFrame != null)
    {
        depthPixelDate = new short[lastDepthFrame.PixelDataLength];
        lastDepthFrame.CopyPixelDataTo(depthPixelDate);
        depthImageBitMap.WritePixels(depthImageBitmapRect, depthPixelDate, depthImageStride, 0);
    }
}

private void DepthImage_MouseLeftButtonUp(object sender, MouseButtonEventArgs e)
{
    Point p = e.GetPosition(DepthImage);
    if (depthPixelDate != null && depthPixelDate.Length > 0)
    {
        Int32 pixelIndex = (Int32)(p.X + ((Int32)p.Y * this.lastDepthFrame.Width));
        Int32 depth = this.depthPixelDate[pixelIndex] >> DepthImageFrame.PlayerIndexBitmaskWidth;
        Int32 depthInches = (Int32)(depth * 0.0393700787);
        Int32 depthFt = depthInches / 12;
        depthInches = depthInches % 12;
        PixelDepth.Text = String.Format("{0}mm~{1}'{2}", depth, depthFt, depthInches);
    }
}

有一点值得注意的是，在UI界面中Image空间的属性中，宽度和高度是硬编码的。如果不设置值，那么空间会随着父容器（From窗体）的大小进行缩放，如果空间的长宽尺寸和深度数据帧的尺寸不一致，当鼠标点击图片时，代码就会返回错误的数据，在某些情况下甚至会抛出异常。像素数组中的数据是固定大小的，它是根据DepthImageStream的Enable方法中的DepthImageFormat参数值来确定的。如果不设置图像控件的大小，那么他就会根据Form窗体的大小进行缩放，这样就需要进行额外的计算，将鼠标的在Form中的位置换算到深度数据帧的维度上。这种缩放和空间转换操作很常见，在后面的文章中我们将会进行讨论，现在为了简单，对图像控件的尺寸进行硬编码。

结果如下图，由于截屏时截不到鼠标符号，所以用红色点代表鼠标位置，下面最左边图片中的红色点位于墙上，该点距离Kinect 2.905米，中间图的点在我的手上，可以看出手离Kinect距离为1.221米，实际距离和这个很相近，可见Kinect的景深数据还是很准确的。

上面最右边图中白色点的深度数据为-1mm。这表示Kinect不能够确定该像素的深度。在处理上数据时，这个值通常是一个特殊值，可以忽略。-1深度值可能是物体离Kinect传感器太近了的缘故。

3. 深度影像增强

在进一步讨论之前，需要会深度值图像进行一些处理。在下面的最左边的图中，灰度级都落在了黑色区域，为了使图像具有更好的灰度级我们需要像之前对彩色数据流图像进行处理那样，对深度值图像进行一些处理。

3.1增强深度影像灰度级

增强深度值图像的最简单方法是按位翻转像素值。图像的颜色是基于深度值的，他们从0开始。在数字光谱中0表示黑色，65536(16位灰阶)表示白色。这意味着下面最左边那幅图中，大部分的值都落在了黑色部分。还有就是所有的不能确定深度值的数据都设置为了0。对位取反操作就会将这些值转换到白色的部分。作为对比，现在在UI上再添加一个Image控件用来显示处理后的值。

<Window x:Class="KinectDepthImageDemo.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="KinectDepthImage" Height="600" Width="1280" WindowStartupLocation="CenterScreen">
    <Grid>
        <StackPanel Orientation="Horizontal">
            <Image x:Name="DepthImage"  Width="640" Height="480" ></Image>
            <Image x:Name="EnhancedDepthImage" Width="640" Height="480" />
        </StackPanel>
    </Grid>
</Window>

下面的代码展示了如何将之前的深度位数据取反获取更好的深度影像数据。该方法在kinectSensor_DepthFrameReady事件中被调用。代码首先创建了一个新的byte数组，然后对这个位数组进行取反操作。注意代码中过滤掉了一些距离太近的点。因为过近的点和过远的点都不准确。所以过滤掉了大于3.5米小于0米的数据，将这些数据设置为白色。

private void CreateLighterShadesOfGray(DepthImageFrame depthFrame, short[] pixelData)
{
    Int32 depth;
    Int32 loThreashold = 0;
    Int32 hiThreshold = 3500;
    short[] enhPixelData = new short[depthFrame.Width * depthFrame.Height];
    for (int i = 0; i < pixelData.Length; i++)
    {
        depth = pixelData[i] >> DepthImageFrame.PlayerIndexBitmaskWidth;
        if (depth < loThreashold || depth > hiThreshold)
        {
            enhPixelData[i] = 0xFF;
        }
        else
        {
            enhPixelData[i] = (short)~pixelData[i];
        }

    }
    EnhancedDepthImage.Source= BitmapSource.Create(depthFrame.Width, depthFrame.Height, 96, 96, PixelFormats.Gray16, null, enhPixelData, depthFrame.Width * depthFrame.BytesPerPixel);
}

经过处理，图像（上面中间那幅图）的表现力提高了一些，但是如果能够将16位的灰度级用32位彩色表示效果会更好。当 RGB值一样时，就会呈现出灰色。灰度值的范围是0~255，0为黑色，255为白色，之间的颜色为灰色。现在将灰色值以RGB模式展现出来。代码如下：

private void CreateBetterShadesOfGray(DepthImageFrame depthFrame, short[] pixelData)
{
    Int32 depth;
    Int32 gray;
    Int32 loThreashold = 0;
    Int32 bytePerPixel = 4;
    Int32 hiThreshold = 3500;
    byte[] enhPixelData = new byte[depthFrame.Width * depthFrame.Height*bytePerPixel];
    for (int i = 0,j=0; i < pixelData.Length; i++,j+=bytePerPixel)
    {
        depth = pixelData[i] >> DepthImageFrame.PlayerIndexBitmaskWidth;
        if (depth < loThreashold || depth > hiThreshold)
        {
            gray = 0xFF;
        }
        else
        {
            gray = (255*depth/0xFFF);
        }
        enhPixelData[j] = (byte)gray;
        enhPixelData[j + 1] = (byte)gray;
        enhPixelData[j + 2] = (byte)gray;

    }
    EnhancedDepthImage.Source = BitmapSource.Create(depthFrame.Width, depthFrame.Height, 96, 96, PixelFormats.Bgr32, null, enhPixelData, depthFrame.Width * bytePerPixel);
}

上面的代码中，将彩色影像的格式改为了Bgr32位，这意味每一个像素占用32位（4个字节）。每一个R,G,B分别占8位，剩余8位留用。这种模式限制了RGB的取值为0-255，所以需要将深度值转换到这一个范围内。除此之外，我们还设置了最小最大的探测范围，这个和之前的一样，任何不在范围内的都设置为白色。将深度值除以4095（0XFFF，深度探测的最大值），然后乘以255，这样就可以将深度数据转换到0至255之间了。运行后效果如上右图所示，可以看出，采用颜色模式显示灰度较之前采用灰度模式显示能够显示更多的细节信息。

3.2 深度数据的彩色渲染

将深度数据值转化到0-255并用RGB模式进行显示可以起到增强图像的效果，能够从图像上直观的看出更多的深度细节信息。还有另外一种简单，效果也不错的方法，那就是将深度数据值转换为色调和饱和度并用图像予以显示。下面的代码展示了这一实现：

private void CreateColorDepthImage(DepthImageFrame depthFrame, short[] pixelData)
{
    Int32 depth;
    Double hue;
    Int32 loThreshold = 1200;
    Int32 hiThreshold = 3500;
    Int32 bytesPerPixel = 4;
    byte[] rgb = new byte[3];
    byte[] enhPixelData = new byte[depthFrame.Width * depthFrame.Height * bytesPerPixel];

    for (int i = 0, j = 0; i < pixelData.Length; i++, j += bytesPerPixel)
    {
        depth = pixelData[i] >> DepthImageFrame.PlayerIndexBitmaskWidth;

        if (depth < loThreshold || depth > hiThreshold)
        {
            enhPixelData[j] = 0x00;
            enhPixelData[j + 1] = 0x00;
            enhPixelData[j + 2] = 0x00;
        }
        else
        {
            hue = ((360 * depth / 0xFFF) + loThreshold);
            ConvertHslToRgb(hue, 100, 100, rgb);

            enhPixelData[j] = rgb[2];  //Blue
            enhPixelData[j + 1] = rgb[1];  //Green
            enhPixelData[j + 2] = rgb[0];  //Red
        }
    }

    EnhancedDepthImage.Source = BitmapSource.Create(depthFrame.Width, depthFrame.Height, 96, 96, PixelFormats.Bgr32, null, enhPixelData, depthFrame.Width * bytesPerPixel);
}

以上代码中使用了ConvertHslToRgb这一函数，该函数的作用是进行两个颜色空间的转换，就是将H(Hue色调)S(Saturation饱和度)L(Light亮度)颜色空间转换到RGB颜色空间的函数。之前学过遥感图像处理，所以对这两个颜色空间比较熟悉。转化的代码如下：

public void ConvertHslToRgb(Double hue, Double saturation, Double lightness, byte[] rgb)
{
    Double red = 0.0;
    Double green = 0.0;
    Double blue = 0.0;
    hue = hue % 360.0;
    saturation = saturation / 100.0;
    lightness = lightness / 100.0;

    if (saturation == 0.0)
    {
        red = lightness;
        green = lightness;
        blue = lightness;
    }
    else
    {
        Double huePrime = hue / 60.0;
        Int32 x = (Int32)huePrime;
        Double xPrime = huePrime - (Double)x;
        Double L0 = lightness * (1.0 - saturation);
        Double L1 = lightness * (1.0 - (saturation * xPrime));
        Double L2 = lightness * (1.0 - (saturation * (1.0 - xPrime)));

        switch (x)
        {
            case 0:
                red = lightness;
                green = L2;
                blue = L0;
                break;
            case 1:
                red = L1;
                green = lightness;
                blue = L0;
                break;
            case 2:
                red = L0;
                green = lightness;
                blue = L2;
                break;
            case 3:
                red = L0;
                green = L1;
                blue = lightness;
                break;
            case 4:
                red = L2;
                green = L0;
                blue = lightness;
                break;
            case 5:
                red = lightness;
                green = L0;
                blue = L1;
                break;
        }
    }

    rgb[0] = (byte)(255.0 * red);
    rgb[1] = (byte)(255.0 * green);
    rgb[2] = (byte)(255.0 * blue);
}

运行程序，会得到如下右图结果（为了对比，下面左边第一幅图是原始数据，第二幅图是使用RGB模式显示深度数据）。最右边图中，离摄像头近的呈蓝色，然后由近至远颜色从蓝色变为紫色，最远的呈红色。图中，我手上托着截图用的键盘，所以可以看到，床离摄像头最近，呈蓝色，键盘比人体里摄像头更近，呈谈蓝色，人体各部分里摄像头的距离也不一样，胸、腹、头部离摄像头更近。后面的墙离摄像头最远，呈橙色至红色。

运行上面的程序会发现很卡，我好不容易才截到这张图，这是因为在将HUL空间向颜色空间转换需要对640*480=307200个像素逐个进行运算，并且运算中有小数，除法等操作。该计算操作和UI线程位于同一线程内，会阻塞UI线程更新界面。更好的做法是将这一运算操作放在background线程中。每一次当KinectSensor触发frame-ready事件时，代码顺序存储彩色影像。转换完成后，backgroud线程使用WPF中的 Dispatcher来更新UI线程中Image对象的数据源。上一篇文章中以及讲过这一问题，这种异步的操作在基于Kinect开发的应用中很常见，因为获取深度数据是一个很频繁的操作。如果将获取数据以及对数据进行处理放在主UI线程中就会使得程序变得很慢，甚至不能响应用户的操作，这降低了用户体验。

4. 结语

本文介绍了Kinect红外摄像头产生的深度影像数据流，KinectSensor探测深度的原理，如何获取像素点的深度值，深度数据的可视化以及一些简单的增强处理。

限于篇幅原因，下一篇文章将会介绍Kinect景深数据影像处理，以及在本文第2节中所景深数据格式中没有讲到的游戏者索引位(Player Index)，最后将会介绍KinectSensor红外传感器如何结合游戏者索引位获取人物的空间范围，包括人物的宽度，高度等信息，敬请期待。

点击此处下载本文所有代码，希望对您了解Kinect SDK有所帮助。

[转载][译]Kinect for Windows SDK开发入门(三)：基础知识下 - yangecnu - 博客园

2015-12-11mikel阅读(981)

来源： [转载][译]Kinect for Windows SDK开发入门(三)：基础知识下 – yangecnu – 博客园

1. 性能改进

上文的代码中，对于每一个彩色图像帧，都会创建一个新的Bitmap对象。由于Kinect视频摄像头默认采集频率为每秒30幅，所以应用程序每秒会创建 30个bitmap对象，产生30次的Bitmap内存创建，对象初始化，填充像素数据等操作。这些对象很快就会变成垃圾等待垃圾回收器进行回收。对数据量小的程序来说可能影响不是很明显，但当数据量很大时，其缺点就会显现出来。

改进方法是使用WriteableBitmap对象。它位于System.Windows.Media.Imaging命名空间下面，该对象被用来处理需要频繁更新的像素数据。当创建WriteableBitmap时，应用程序需要指定它的高度，宽度以及格式，以使得能够一次性为 WriteableBitmap创建好内存，以后只需根据需要更新像素即可。

使用WriteableBitmap代码改动地方很小。下面的代码中，首先定义三个新的成员变量，一个是实际的WriteableBitmap对象，另外两个用来更新像素数据。每一幅图像的大小都是不变的，因此在创建WriteableBitmap时只需计算一次即可。

InitializeKinect方法中加粗的部分是更改的代码。创建WriteableBitmap对象，准备接收像素数据，图像的范围同时也计算了。在初始化WriteableBitmap的时候，同时也绑定了UI元素(名为ColorImageElement的Image对象)。此时 WriteableBitmap中没有像素数据，所以UI上是空的。

private WriteableBitmap colorImageBitmap;
private Int32Rect colorImageBitmapRect;
private int colorImageStride;
private byte[] colorImagePixelData;

if (kinectSensor != null)
{   
    ColorImageStream colorStream=kinectSensor.ColorStream;
    colorStream.Enable();
    this.colorImageBitMap = new WriteableBitmap(colorStream.FrameWidth, colorStream.FrameHeight,
                                                                    96, 96, PixelFormats.Bgr32, null);
    this.colorImageBitmapRect = new Int32Rect(0, 0, colorStream.FrameWidth, colorStream.FrameHeight);
    this.colorImageStride = colorStream.FrameWidth * colorStream.FrameBytesPerPixel;
    ColorImageElement.Source = this.colorImageBitMap;

    kinectSensor.ColorFrameReady += kinectSensor_ColorFrameReady;
    kinectSensor.Start();
}

还需要进行的一处改动是，对ColorFrameReady事件响应的代码。如下图。首先删除之前创建Bitmap那部分的代码。调用 WriteableBitmap对象的WritePixels方法来更新图像。方法使用图像的矩形范围，代码像素数据的数组，图像的Stride，以及偏移(offset).偏移量通常设置为0。

private void Kinect_ColorFrameReady(object sender, ColorImageFrameReadyEventArgs e)
{
   using (ColorImageFrame frame = e.OpenColorImageFrame())
  {
     if (frame != null)
     {
        byte[] pixelData = new byte[frame.PixelDataLength];
        frame.CopyPixelDataTo(pixelData);
        this.colorImageBitmap.WritePixels(this.colorImageBitmapRect, pixelData, this.colorImageStride, 0);
     }
   }
}

基于Kinect的应用程序在无论是在显示ColorImageStream数据还是显示DepthImageStream数据的时候，都应该使用 WriteableBitmap对象来显示帧影像。在最好的情况下，彩色数据流会每秒产生30帧彩色影像，这意味着对内存资源的消耗比较大。 WriteableBitmap能够减少这种内存消耗，减少需要更新影响带来的内存开辟和回收操作。毕竟在应用中显示帧数据不是应用程序的最主要功能，所以在这方面减少内像存消耗显得很有必要。

2. 简单的图像处理

每一帧ColorImageFrame都是以字节序列的方式返回原始的像素数据。应用程序必须以这些数据创建图像。这意味这我们可以对这些原始数据进行一定的处理，然后再展示出来。下面来看看如何对获取的原始数据进行一些简单的处理。

void kinectSensor_ColorFrameReady(object sender, ColorImageFrameReadyEventArgs e)
{
    using (ColorImageFrame frame = e.OpenColorImageFrame())
    {
        if (frame != null)
        {
            byte[] pixelData = new byte[frame.PixelDataLength];
            frame.CopyPixelDataTo(pixelData);
            for (int i = 0; i < pixelData.Length; i += frame.BytesPerPixel)
            {
               pixelData[i] = 0x00;//蓝色
               pixelData[i + 1] = 0x00;//绿色
             }
           this.colorImageBitMap.WritePixels(this.colorImageBitmapRect, pixelData,this.colorImageStride,0);
        }
    }
}

以上的实验关闭了每个像素点的蓝色和绿色通道。for循环遍历每个像素，使得i的起始位置重视该像素的第一个字节。由于数据的格式是Bgr32，即 RGB32位(一个像素共占4个字节，每个字节8位)，所以第一个字节是蓝色通道，第二个是绿色，第三个是红色。循环体类，将第一个和第二个通道设置为 0.所以输出的代码中只用红色通道的信息。这是最基本的图像处理。

代码中对像素的操作和像素着色函数相识，可以通过很复杂的算法来进行。大家可以试试对这些像素赋予一些其它的值然后再查看图像的显示结果。这类操作通常很消耗计算资源。像素着色通常是GPU上的一些很基础的操作。下面有一些简单的算法用来对像素进行处理。

Inverted Color

pixelData[i]=(byte)~pixelData[i];

pixelData[i+1]=(byte)~pixelData[i+1];

pixelData[i+2]=(byte)~pixelData[i+2];

Apocalyptic Zombie

pixelData[i]= pixelData[i+1];

pixelData[i+1]= pixelData[i];

pixelData[i+2]=(byte)~pixelData[i+2];

Gray scale

byte gray=Math.Max(pixelData[i],pixelData[i+1])

gray=Math.Max(gray,pixelData[i+2]);

pixelData[i]=gray;

pixelData[i+1]=gray;

pixelData[i+2]=gray;

Grainy black and white movie

byte gray=Math.Min(pixelData[i],pixelData[i+1]);

gray=Math.Min(gray,pixelData[i+2]);

pixelData[i]=gray;

pixelData[i+1]=gray;

pixelData[i+2] =gray;

Washed out color

double gray=(pixelData[i]*0.11)+(pixelData[i+1]*0.59)+(pixelData[i+2]*0.3);

double desaturation=0.75;

pixelData[i]=(byte)(pixelData[i]+desaturation*(gray-pixelData[i]));

pixelData[i+1]=(byte)(pixelData[i+1]+desaturation*(gray-pixelData[i+1]));

pixelData[i+2]=(byte)(pixelData[i+2]+desatuation*(gray-pixelData[i+2]));

High saturation

If (pixelData[i]<0x33||pixelData[i]>0xE5)

{

pixelData[i]=0x00;

} else

{

pixelData[i]=0Xff;

}

If (pixelData[i+1]<0x33||pixelData[i+1]>0xE5)

{

pixelData[i+1]=0x00;

} else

{

pixelData[i+1]=0Xff;

}

If (pixelData[i+2]<0x33||pixelData[i+2]>0xE5)

{

pixelData[i+2]=0x00;

} else

{

pixelData[i+1]=0Xff;

}

一下是上面操作后的图像：

3. 截图

有时候，可能需要从彩色摄像头中截取一幅图像，例如可能要从摄像头中获取图像来设置人物头像。为了实现这一功能，首先需要在界面上设置一个按钮，代码如下：

<Window x:Class="KinectApplicationFoundation.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="ColorImageStreamFromKinect" Height="350" Width="525">
    <Grid>
        <Image x:Name="ColorImageElement"></Image>
        <StackPanel HorizontalAlignment="Left" VerticalAlignment="Top">
            <Button Content="Take Picture" Click="TakePictureButton_Click" />
        </StackPanel>
    </Grid>
</Window>

private void TakePictureButton_Click(object sender, RoutedEventArgs e)
{
    String fileName = "snapshot.jpg";
    if (File.Exists(fileName))
    {
        File.Delete(fileName);
    }

    using (FileStream savedSnapshot=new FileStream(fileName,FileMode.CreateNew))
    {
        BitmapSource image =(BitmapSource) ColorImageElement.Source;
        JpegBitmapEncoder jpgEncoder = new JpegBitmapEncoder();
        jpgEncoder.QualityLevel = 70;
        jpgEncoder.Frames.Add(BitmapFrame.Create(image));
        jpgEncoder.Save(savedSnapshot);

        savedSnapshot.Flush();
        savedSnapshot.Close();
        savedSnapshot.Dispose();
    }
}

为了演示，上面的代码中在当前目录创建了一个文件名。这是一种简单保存文件的方法。我们使用FileStream打开一个文件。 JpegBitmapEncoder对象将UI上的图像转换为一个标准的JPEG文件，保存完后，需要调用对象的flush方法，然后关闭，最后释放对象。虽然这三部不需要，因为我们使用了using语句，这里是为了演示，所以把这三步加上了。

4. ColorImageStream对象图

到此为止，我们讨论了如何发现以及初始化Kinect传感器，从Kinect的影像摄像头获取图片。现在让我们来看看一些关键的类，以及他们之间的关系。下图展现了ColorImageStream的对象模型图。

ColorImageStream是KinectSensor对象的一个属性，如同KinectSensorde其它流一样，色彩数据流在使用之前需要调用Enable方法。ColorImageStream有一个重载的Enabled方法，默认的Eanbled方法没有参数，重载的方法有一个 ColorImageFormat参数，他是一个枚举类型，可以使用这个参数指定图像格式。下表列出了枚举成员。默认的Enabled将 ColorImageStream设置为每秒30帧的640*480的RGB影像数据。一旦调用Enabled方法后，就可以通过对象的Foramt属性获取到图像的格式了。

ColorImageStream 有5个属性可以设置摄像头的视场。这些属性都以Nominal开头，当Stream被设置好后，这些值对应的分辨率就设置好了。一些应用程序可能需要基于摄像头的光学属性比如视场角和焦距的长度来进行计算。ColorImageStream建议程序员使用这些属性，以使得程序能够面对将来分辨率的变化。

ImageStream是ColorImageStream的基类。因此ColorImageStream集成了4个描述每一帧每一个像素数据的属性。在之前的代码中，我们使用这些属性创建了一个WriteableBitmap对象。这些属性与ColorImageFormat的设置有关。 ImageStream中除了这些属性外还有一个IsEnabled属性和Disable方法。IsEnabled属性是一个只读的。当Stream打开时返回true，当调用了Disabled方法后就返回false了。Disable方法关闭Stream流，之后数据帧的产生就会停止，ColorFrameReady事件的触发也会停止。当ColorImageStream设置为可用状态后，就能产生ColorImageFrame 对象。ColorImageFrame对象很简单。他有一个Format方法，他是父类的ColorImageFormat值。他只有一个 CopyPixelDataTo方法，能够将图像的像素数据拷贝到指定的byte数组中，只读的PixelDataLength属性定义了数组的大小 PixelDataLength属性通过对象的宽度，高度以及每像素多少位属性来获得的。这些属性都继承自ImageFrame抽象类。

数据流的格式决定了像素的格式，如果数据流是以ColorImageFormat.RgbResolution640*480Fps30格式初始化的，那么像素的格式就是Bgr32，它表示每一个像素占32位(4个字节)，第一个字节表示蓝色通道值，第二个表示绿色，第三个表示红色。第四个待用。当像素的格式是Bgra32时，第四个字节表示像素的alpha或者透明度值。如果一个图像的大小是640*480，那么对于的字节数组有122880个字节 (width*height*BytesPerPixel=640*480*4).在处理影像时有时候也会用到Stride这一术语，他表示影像中一行的像素所占的字节数，可以通过图像的宽度乘以每一个像素所占字节数得到。

除了描述像素数据的属性外，ColorImageFrame对象还有一些列描述本身的属性。Stream会为每一帧编一个号，这个号会随着时间顺序增长。应用程序不要假的每一帧的编号都比前一帧恰好大1，因为可能出现跳帧现象。另外一个描述帧的属性是Timestamp。他存储自KinectSensor 开机(调用Start方法)以来经过的毫秒数。当每一次KinectSensor开始时都会复位为0。

5. 获取数据的方式：事件模式 VS “拉”模式

目前为止我们都是使用KinectSensor对象的事件来获取数据的。事件在WPF中应用很广泛，在数据或者状态发生变化时，事件机制能够通知应用程序。对于大多数基于Kinect开发的应用程序来说基于事件的数据获取方式已经足够；但它不是唯一的能从数据流中获取数据的模式。应用程序能够手动的从 Kinect数据流中获取到新的帧数据。

“拉”数据的方式就是应用程序会在某一时间询问数据源是否有新数据，如果有，就加载。每一个Kinect数据流都有一个称之为OpenNextFrame 的方法。当调用OpenNextFrame的方式时，应用程序可以给定一个超时的值，这个值就是应用程序愿意等待新数据返回的最长时间，以毫秒记。方法试图在超时之前获取到新的数据帧。如果超时，方法将会返回一个null值。

当使用事件模型时，应用程序注册数据流的frame-ready事件，为其指定方法。每当事件触发时，注册方法将会调用事件的属性来获取数据帧。例如，在使用彩色数据流时，方法调用ColorImageFrameReadyEventArgs对象的OpenColorImageFrame方法来获取 ColorImageFrame对象。程序应该测试获取的ColorImageFrame对象是否为空，因为有可能在某些情况下，虽然事件触发了，但是没有产生数据帧。除此之外，事件模型不需要其他的检查和异常处理。相比而言，OpenNextFrame方法在KinectSensor没有运行、 Stream没有初始化或者在使用事件获取帧数据的时候都有可能会产生InvalidOperationException异常。应用程序可以自由选择何种数据获取模式，比如使用事件方式获取ColorImageStream产生的数据，同时采用“拉”的方式从SkeletonStream流获取数据。但是不能对同一数据流使用这两种模式。AllFrameReady事件包括了所有的数据流—意味着如果应用程序注册了AllFrameReady事件。任何试图以拉的方式获取流中的数据都会产生InvalidOperationException异常。

在展示如何以拉的模式从数据流中获取数据之前，理解使用模式获取数据的场景很有必要。使用“拉”数据的方式获取数据的最主要原因是性能，只在需要的时候采取获取数据。他的缺点是，实现起来比事件模式复杂。除了性能，应用程序的类型有时候也必须选择“拉”数据的这种模式。SDK也能用于XNA，他不同与 WPF，它不是事件驱动的。当需要使用XNA开发游戏时，必须使用拉模式来获取数据。使用SDK也能创建没有用户界面的控制台应用程序。设想开发一个使用 Kinect作为眼睛的机器人应用程序，他通过源源不断的主动从数据流中读取数据然后输入到机器人中进行处理，在这个时候，拉模型是比较好的获取数据的方式。下面的代码展示了如何使用拉模式获取数据：

private KinectSensor _Kinect;
private WriteableBitmap _ColorImageBitmap;
private Int32Rect _ColorImageBitmapRect;
private int _ColorImageStride;
private byte[] _ColorImagePixelData;
public MainWindow()
{
    InitializeComponent();
    CompositionTarget.Rendering += CompositionTarget_Rendering;
}
private void CompositionTarget_Rendering(object sender, EventArgs e)
{
    DiscoverKinectSensor();
    PollColorImageStream();
}

代码声明部分和之前的一样。基于“拉”方式获取数据也需要发现和初始化KinectSensor对象。方法使用WriteBitmap来创建帧影像。最大的不同是，在构造函数中我们将Rendering事件绑定到CompositionTarget对象上。ComposationTarget对象表示应用程序中可绘制的界面。Rendering事件会在每一个渲染周期上触发。我们需要使用循环来取新的数据帧。有两种方式来创建循环。一种是使用线程，将在下一节中介绍。另一种方式是使用普通的循环语句。使用CompositionTarget对象有一个缺点，就是Rendering事件中如果处理时间过长会导致UI线程问题。因为时间处理在主UI线程中。所以不应在事件中做一些比较耗时的操作。Redering 事件中的代码需要做四件事情。必须发现一个连接的KinectSnesor，初始化传感器。响应传感器状态的变化，以及拉取新的数据并对数据进行处理。我们将这四个任务分为两个方法。下面的代码列出了方法的实现。和之前的代码差别不大：

private void DiscoverKinectSensor()
{
    if(this._Kinect != null && this._Kinect.Status != KinectStatus.Connected)
    {
        this._Kinect = null;
    }

    if(this._Kinect == null)
    {
        this._Kinect = KinectSensor.KinectSensors.FirstOrDefault(x => x.Status == KinectStatus.Connected);

        if(this._Kinect != null)
        {
            this._Kinect.ColorStream.Enable();
            this._Kinect.Start();

            ColorImageStream colorStream    = this._Kinect.ColorStream;
            this._ColorImageBitmap          = new WriteableBitmap(colorStream.FrameWidth, colorStream.FrameHeight, 96, 96, PixelFormats.Bgr32, null);
            this._ColorImageBitmapRect      = new Int32Rect(0, 0, colorStream.FrameWidth, colorStream.FrameHeight);
            this._ColorImageStride          = colorStream.FrameWidth * colorStream.FrameBytesPerPixel;
            this.ColorImageElement.Source   = this._ColorImageBitmap;
            this._ColorImagePixelData       = new byte[colorStream.FramePixelDataLength];
        }
    }
}

下面的代码列出了PollColorImageStream方法的实现。代码首先判断是否有KinectSensor可用.然后调用 OpneNextFrame方法获取新的彩色影像数据帧。代码获取新的数据后，然后更新WriteBitmap对象。这些操作包在using语句中，因为调用OpenNextFrame对象可能会抛出异常。在调用OpenNextFrame方法时，将超时时间设置为了100毫秒。合适的超时时间设置能够使得程序在即使有一两帧数据跳过时仍能够保持流畅。我们要尽可能的让程序每秒产生30帧左右的数据。

private void PollColorImageStream()
{
    if(this._Kinect == null)
    {
        //TODO: Display a message to plug-in a Kinect.
    }
    else
    {
        try
        {
            using(ColorImageFrame frame = this._Kinect.ColorStream.OpenNextFrame(100))
            {
                if(frame != null)
                {                            
                    frame.CopyPixelDataTo(this._ColorImagePixelData);
                    this._ColorImageBitmap.WritePixels(this._ColorImageBitmapRect, this._ColorImagePixelData, this._ColorImageStride, 0);                    
                }
            }
        }
        catch(Exception ex)
        {
            //TODO: Report an error message
        }   
    }
}

总体而言，采用拉模式获取数据的性能应该好于事件模式。上面的例子展示了使用拉方式获取数据，但是它有另一个问题。使用 CompositionTarget对象，应用程序运行在WPF的UI线程中。任何长时间的数据处理或者在获取数据时超时时间的设置不当都会使得程序变慢甚至无法响应用户的行为，因为这些操作都执行在UI线程上。解决方法是创建一个新的线程，然后在这个线程上执行数据获取和处理操作。在.net中使用BackgroundWorker类能够简单的解决这个问题。代码如下：

private void Worker_DoWork(object sender, DoWorkEventArgs e)
{
    BackgroundWorker worker = sender as BackgroundWorker;
    if(worker != null)
    {
        while(!worker.CancellationPending)
        {
            DiscoverKinectSensor();                
            PollColorImageStream();                
        }
    }
}

首先，在变量声明中加入了一个BackgroundWorker变量 _Worker。在构造函数中，实例化了一个BackgroundWorker类，并注册了DoWork事件，启动了新的线程。当线程开始时就会触发 DoWork事件。事件不断循环知道被取消。在循环体中，会调用DiscoverKinectSensor和PollColorImageStream方法。如果直接使用之前例子中的这两个方法，你会发现会出现InvalidOperationException异常，错误提示为“The calling thread cannot access this object because a different thread owns it”。这是由于，拉数据在background线程中，但是更新UI元素却在另外一个线程中。在background线程中更新UI界面，需要使用 Dispatch对象。WPF中每一个UI元素都有一个Dispathch对象。下面是两个方法的更新版本：

private void DiscoverKinectSensor()
{
    if(this._Kinect != null && this._Kinect.Status != KinectStatus.Connected)
    {
        this._Kinect = null;
    }

    if(this._Kinect == null)
    {
        this._Kinect = KinectSensor.KinectSensors
                                    .FirstOrDefault(x => x.Status == KinectStatus.Connected);
        if(this._Kinect != null)
        {
            this._Kinect.ColorStream.Enable();
            this._Kinect.Start();
            ColorImageStream colorStream    = this._Kinect.ColorStream;
            this.ColorImageElement.Dispatcher.BeginInvoke(new Action(() => 
            { 
                this._ColorImageBitmap          = new WriteableBitmap(colorStream.FrameWidth, colorStream.FrameHeight, 96, 96, PixelFormats.Bgr32, null);
                this._ColorImageBitmapRect      = new Int32Rect(0, 0, colorStream.FrameWidth, colorStream.FrameHeight);
                this._ColorImageStride          = colorStream.FrameWidth * colorStream.FrameBytesPerPixel;                    
                this._ColorImagePixelData       = new byte[colorStream.FramePixelDataLength];
                        
                this.ColorImageElement.Source = this._ColorImageBitmap; 
            }));
        }
    }
}

private void PollColorImageStream()
{
    if(this._Kinect == null)
    {
        //TODO: Notify that there are no available sensors.
    }
    else
    {
        try
        {
            using(ColorImageFrame frame = this._Kinect.ColorStream.OpenNextFrame(100))
            {
                if(frame != null)
                {                            
                    frame.CopyPixelDataTo(this._ColorImagePixelData);
                            
                    this.ColorImageElement.Dispatcher.BeginInvoke(new Action(() => 
                    {
                        this._ColorImageBitmap.WritePixels(this._ColorImageBitmapRect, this._ColorImagePixelData, this._ColorImageStride, 0);
                    }));
                }
            }
        }
        catch(Exception ex)
        {
            //TODO: Report an error message
        }   
    }
}

到此为止，我们展示了两种采用“拉”方式获取数据的例子，这两个例子都不够健壮。比如说还需要对资源进行清理，比如他们都没有释放KinectSensor对象，在构建基于Kinect的实际项目中这些都是需要处理的问题。

“拉”模式获取数据跟事件模式相比有很多独特的好处，但它增加了代码量和程序的复杂度。在大多数情况下，事件模式获取数据的方法已经足够，我们应该使用该模式而不是“拉”模式。唯一不能使用事件模型获取数据的情况是在编写非WPF平台的应用程序的时候。比如，当编写XNA或者其他的采用拉模式架构的应用程序。建议在编写基于WPF平台的Kinect应用程序时采用事件模式来获取数据。只有在极端注重性能的情况下才考虑使用“拉”的方式。

6. 结语

本节介绍了采用WriteableBitmap改进程序的性能，并讨论了ColorImageStream中几个重要对象的对象模型图并讨论了个对象之间的相关关系。最后讨论了在开发基于Kinect应用程序时，获取KinectSensor数据的两种模式，并讨论了各自的优缺点和应用场合，这些对于之后的DepthImageSteam和SkeletonStream也是适用的。

下一篇文章将会对KinectSensor特有的红外传感器产生的DepthImageStream进行介绍，敬请期待。

[转载]WPF相关2 - jiegeluo - 博客园

2015-12-11mikel阅读(1013)

来源： [转载]WPF相关2 – jiegeluo – 博客园

1、关于多线程问题：

wpf中的多线程的使用：

1）使用Backgroundwork类。在主线程中声明一个backgroundwork对象（可以在XAML中，也可以在后台代码中。一般在XAML中声明，这样可以同时声明该对象的进程管理、取消操作等的事件）。

        xmlns:cm="clr-namespace:System.ComponentModel;assembly=System"

    <Window.Resources>
        <cm:BackgroundWorker x:Key="backgroundworker" DoWork="BackgroundWorker_DoWork_1" ProgressChanged="BackgroundWorker_ProgressChanged_1" RunWorkerCompleted="BackgroundWorker_RunWorkerCompleted_1" WorkerReportsProgress="True" WorkerSupportsCancellation="True"/>
    </Window.Resources>

在xaml中声明时，需要相应的命名空间。

对于多线程使用，一个最重要的问题是：在子线程中调用主线程的控件对象。（这里只说控件对象，我发现好像只有对主线程的控件对象，如果直接在线程中调用才会出错。要是其他普通类对象，在子线程中可以使用，不知道是不是我试验的不够，偶然成了这样）。backgroundwork的 ReportProgress(int)和完成函数中都是可以直接调用主线程的控件对象的。所以将backgroundwork的使用分成以下步骤：a/ 声明backgroundwork。 b/在 DoWork=”BackgroundWorker_DoWork_1″对应的函数中调用需要多线程的工作，同时在需要更改主线程控件的地方调用 ReportProgress(int)方法，它会调用 ProgressChanged=”BackgroundWorker_ProgressChanged_1″所对应的方法。 c/调用backgroundwork的RunWorkerAsync函数。

2）Dispatcher

2、数据绑定：

数据源为具体对象。

[转载]Kinect cursor for hand tracking | Vangos Pterneas

2015-12-09mikel阅读(1184)

来源： [转载]Kinect cursor for hand tracking | Vangos Pterneas

Kinect cursor for hand tracking

Posted by Vangos Pterneas | June 06, 2014 | C#, CodeProject, Kinect | 17 Comments

Navigating through a Natural User Interface using your palm is quite common – after all, it’s the primary navigation mechanism XBOX uses. Many Windows Kinect applications implement hand tracking for similar purposes. Today, I would like to share a Kinect hand cursor control I developed and you can use for your own apps. This hand cursor control will save you tons of time and you’ll be able to integrate it right into your existing WPF code!

Download from GitHub

Here is the final result of this handful user control:

Using the control in your project is fairly easy. Read on!

Prerequisites

Kinect for Windows or Kinect for XBOX sensor
Microsoft Kinect SDK

The code

OK, let’s type some quick code now.

Step 1: Download the project from GitHub

Download the source code and build it using Visual Studio. Locate the assembly named KinectControls.dll.

Step 2: Import the assembly to your project

Create a new WPF project and add a reference to the assembly you built previously.

Step 3: Import the assembly to your XAML code

Type the following line of code in your Window, view or user control definition:


xmlns:Controls="clr-namespace:KinectControls;assembly=KinectControls"

You can now drag a Canvas and place the hand cursor inside it:

<Canvas Name="canvas" Width="640" Height="480">
    <Controls:KinectCursor x:Name="cursor" Width="100" Height="100" />
</Canvas>

Step 4: Move the cursor using C#

The KinectCursor class contains a method named Update. You need to call that method whenever you want to move the cursor. The Update method gets the X and Y coordinates of the hand in the 2D color or depth space. Alternatively, you can provide a ColorSpacePoint or DepthSpacePoint that contains the coordinates. I placed this code inside SkeletonFrameReady event handler. You can specify the “active” hand by comparing the Z values of the left and right hands.


// Select the hand that is closer to the sensor.
var activeHand = handRight.Position.Z <= handLeft.Position.Z ? handRight : handLeft;
var position = _sensor.CoordinateMapper.MapSkeletonPointToColorPoint(
                                        activeHand.Position,
                                        ColorImageFormat.RgbResolution640x480Fps30);

cursor.Flip(activeHand);                            
cursor.Update(position);

Also, notice the Flip method? The Flip method mirrors the cursor visual, so to properly match the active hand. That’s it! You can check the complete source code on GitHub.

The hand image is a scalable vector shape I designed. You can change its color, dimensions or shadow effects easily:


<Controls:KinectCursor x:Name="cursor" Width="400" Height="400" Fill="Blue" />

Copyrights

You are free to use the user control as you wish for your personal and commercial projects, just by making a simple attribution in your project.

[转载][译]Kinect for Windows SDK开发入门(二)：基础知识上 - yangecnu - 博客园

2015-12-09mikel阅读(973)

来源： [转载][译]Kinect for Windows SDK开发入门(二)：基础知识上 – yangecnu – 博客园

上篇文章介绍了Kinect开发的环境配置，这篇文章和下一篇文章将介绍Kinect开发的基本知识，为深入研究Kinect for Windows SDK做好基础。

每一个Kinect应用都有一些基本元素。应用程序必须探测和发现链接到设备上的Kinect传感器。在使用这些传感器之前，必须进行初始化，一旦初始化成功后，就能产生数据，我们的程序就能处理这些数据。最后当应用程序关闭是，必须合理的释放这些传感器。

本文第一部分将会介绍如何探测初始化几释放传感器，这是非常基础的话题，但是对于基于Kinect开发的应用程序非常重要。一旦初始化好了之后，Kinect的各种传感器就能够产生数据。我们的程序可以读取这些数据流。Kinect产生的数据流类类似于System.IO命名空间下面的IO数据流。

第二部分将详细介绍数据流的基础，并演示如何从Kinect中使用ColorImageStream获取彩色摄像头产生的数据。数据流能够生产基于像素的数据，使得能够像从相机或者基本的相片那样生产彩色图像。可以对这些数据进行各种有趣的处理。

本文是整个Kinect SDK开发的基础部分，了解了这些之后，对于熟悉SDK中其他部分比较有帮助。

1. Kinect传感器

基于Kinect开发的应用程序最开始需要用到的对象就是KinectSensor对象，该对象直接表示Kinect硬件设备。KinectSensor 对象是我们想要获取数据，包括彩色影像数据，景深数据和骨骼追踪数据的源头。本文将详细介绍ColorImageStream，后面的文章将详细讨论 DepthImageStream和SkeletonStream。

从KinectSensor获取数据最常用的方式是通过监听该对象的一系列事件。每一种数据流都有对应的事件，当改类型数据流可用时，就会触发改时间。每一个数据流以帧(frame)为单位。例如：ColorImageStream当获取到了新的数据时就会触发ColorFrameReady事件。当在讨论各个具体的传感器数据流是我们将会详细讨论这些事件。

每一种数据流(Color,Depth,Skeleton)都是以数据点的方式在不同的坐标系中显示的，在后面的讨论中我们能够清楚的看到这一点。将一个数据流中的点数据转换到另一个数据流中是一个很常见的操作，在本文的后面将会讨论如何转换以及为什么这种转换很有必要。KinectSensor对象有一些列的方法能够进行数据流到数据点阵的转换，他们是 MapDepthToColorImagePoint，MapDepthToSkeletonPoint以及 MapSkeletonPointToDepth。在获取Kinect数据前，我们必须先发现连接的Kinect设备。发现Kinect设备很简单，但是也有需要主注意的地方。

1.1 发现连接的Kinect设备

KinectObject对象没有公共的构造器，应用程序不能直接创建它。相反，该对象是SDK在探测到有连接的Kinect设备时创建的。当有 Kinect设备连接到计算机上时，应用程序应该得到通知或者提醒。KinectSeneor对象有一个静态的属性KinectSensors，该属性是一个KinectSensorCollection集合，该集合继承自ReadOnlyCollection，ReadOnlyCollection集合很简单，他只有一个索引器和一个称之为StatusChanged的事件。

使用集合中的索引器来获取KinectSensor对象。集合中元素的个数就是Kinect设备的个数。也就是说，一台电脑上可以连接多个Kinect设备来从不同的方向获取数据。应用程序可以使用多个Kinect设备来获取多方面的数据，Kinect个数的限制只有电脑配置的限制。由于每个Kinect是通过USB来进行数据传输的，所以每一个Kinect设备需要一条USB线与电脑相连。此外，更多的 Kinect设备需要更多的CPU和内存消耗。

查找Kinect设备可以通过简单的遍历集合找到；但是KinectSensor集合中的设备不是都能直接使用，所以KinectSensor对象有一个Status属性，他是一个枚举类型，标识了当前Kinect设备的状态。下表中列出了传感器的状态及其含义：

只有设备在Connected状态下时，KinectSensor对象才能初始化。在应用的整个生命周期中，传感器的状态可能会发生变化，这意味着我们开发的应用程序必须监控设备的连接状态，并且在设备连接状态发生变化时能够采取相应的措施来提高用户体验。例如，如果连接Kinect的USB线从电脑拔出，那么传感器的连接状态就会变为Disconnected，通常，应用程序在这种情况下应该暂停，并提示用户将Kinect设备插入到电脑上。应用程序不应该假定在一开始时Kinect设备就处于可用状态，也不应该假定在整个程序运行的过程中，Kinect设备会一直与电脑连接。

下面，首先创建一个WPF应用程序来展示如何发现，获取Kinect传感器的状态。先建按一个WPF项目，并添加Microsoft.Kinect.dll。在MainWindows.xaml.cs中写下如下代码：

public partial class MainWindow : Window
{
    //私有Kinectsensor对象
    private KinectSensor kinect;

    public KinectSensor Kinect
    {
        get { return this.kinect;}
        set {
            //如果带赋值的传感器和目前的不一样
            if (this.kinect!=value)
            {
                //如果当前的传感对象不为null
                if (this.kinect!=null)
                {
                 //uninitailize当前对象
                    this.kinect=null;
                }
                //如果传入的对象不为空，且状态为连接状态
                if (value!=null&&value.Status==KinectStatus.Connected)
                {
                    this.kinect=value;
                }
            }
        }
    }

    public MainWindow()
    {
        InitializeComponent();
        this.Loaded += (s, e) => DiscoverKinectSensor();
        this.Unloaded += (s, e) => this.kinect = null;
    }

    private void DiscoverKinectSensor()
    {
        KinectSensor.KinectSensors.StatusChanged += KinectSensors_StatusChanged;
        this.Kinect = KinectSensor.KinectSensors.FirstOrDefault(x => x.Status == KinectStatus.Connected);
    }

    private void KinectSensors_StatusChanged(object sender, StatusChangedEventArgs e)
    {
        switch (e.Status)
        {
            case KinectStatus.Connected:
                if (this.kinect == null)
                    this.kinect = e.Sensor;
                break;
            case KinectStatus.Disconnected:
                if (this.kinect == e.Sensor)
                {
                    this.kinect = null;
                    this.kinect = KinectSensor.KinectSensors.FirstOrDefault(x => x.Status == KinectStatus.Connected);
                    if (this.kinect == null)
                    {
                        //TODO:通知用于Kinect已拔出
                       }
                }
                break;
            //TODO:处理其他情况下的状态
        }
    }
}

上面的代码注释很详细，首先定义了一个私有变量kinect，应用程序应该定义一个私有的变量来存储对获取到的KincectSensor对象的引用，当应用程序不在需要KinectSensor产生数据时，可以使用这个局部变量来释放对KinectSensor对象的引用从而释放资源。我们还定义了一个 Kinect属性来对这个私有变量进行包装，使用属性的目的是保证能够以正确的方式初始化和反初始化KinectSensor对象。在Set方法中我们可以看到，自由待赋值的对象的组航太是Connected的时候我们才进行赋值操作，任何将没有处在Connected状态的传感器对象复制给 KinectSensor对象时都会抛出InvalidOperationException异常。

在构造函数中有两个匿名方法，一个用来监听Loaded事件，一个用来监听Unloaded事件。当卸载时应该将Kinect属性置为空。在窗口的 Loaded事件中程序通过DiscoverKinectSensor方法试图调用一个连接了的传感器。在窗体的Loaded和Unloaded事件中注册这两个事件用来初始化和释放Kinect对象，如果应用程序没有找到Kinect对象，将会通知用户。

DiscoverKinectSensor方法只有两行代码，第一行代码注册StatusChanged事件，第二行代码通过lambda表达式查询集合中第一个处在Connected状态的传感器对象，并将该对象复制给Kinect属性。Kinect属性的set方法确保能都赋值一个合法的Kinect 对象。

StatusChanged事件中值得注意的是，当状态为KinectSensor.Connected的时候，if语句限制了应用程序只能有一个kinect传感器，他忽略了电脑中可能连接的其他Kinect传感器。

以上代码展示了用于发现和引用Kinect设备的最精简的代码，随着应用的复杂，可能需要更多的代码来保证线程安全以及能让垃圾回收器及时释放资源以防止内存泄露。

1.2 打开传感器

一旦发现了传感器，在应用程序能够使用传感器之前必须对其进行初始化。传感器的初始化包括三个步骤。首先，应用程序必须设置需要使用的数据流，并将其状态设为可用。每一中类型的数据流都有一个Enable方法，该方法可以初始化数据流。每一种数据流都完全不同，在使用之前需要进行一些列的设置。在一些情况下这些设置都在Enable方法中处理了。在下面，我们将会讨论如何初始化ColorImageStream数据流，在以后的文章中还会讨论如何初始化 DepthImageStream数据流和SkeletonStream数据流。

初始化之后，接下来就是要确定应用程序如何使用产生的数据流。最常用的方式是使用Kinect对象的一些列事件，每一种数据流都有对应的事件，他们是：ColorImageStream对应ColorFrameReady事件、DepthImageStream对应DepthFrameReady事件、SkeletonStream对象对应SkeletonFrameReady事件。以及AllFramesReady事件。各自对应的事件只有在对应的数据流enabled后才能使用，AllFramesReady事件在任何一个数据流状态enabled时就能使用。

最后，应用程序调用KinectSensor对象的Start方法后，frame-ready事件就会触发从而产生数据。

1.3 停止传感器

一旦传感器打开后，可以使用KinectSensor对象的Stop方法停止。这样所有的数据产生都会停止，因此在监听frameready事件时要先检查传感器是否不为null。

KinectSensor对象以及数据流都会使用系统资源，应用程序在不需要使用KinectSensor对象时必须能够合理的释放这些资源。在这种情况下，程序不仅要停止传单器，还用注销frameready事件。注意，不要去调用KinectSensor对象的Dispose方法。这将会阻止应用程序再次获取传感器。应用程序必须从启或者将Kinect从新拔出然后插入才能再次获得并使用对象。

2. 彩色影像数据流

Kinect有两类摄像头，近红外摄像头和普通的视频摄像头。视频摄像头提供了一般摄像头类似的彩色影像。这种数据流是三中数据流中使用和设置最简单的。因此我将他作为Kinect数据流介绍的例子。

使用Kinect数据流也有三部。首先是数据流必须可用。一旦数据流可用，应用程序就可以从数据量中读取数据并对数据进行处理和展现。一旦有新的数据帧可用，这两个步骤就会一直进行，下面的代码展现了如何初始化ColorImage对象。

public KinectSensor Kinect
{
    get { return this.kinect;}
    set {
        //如果带赋值的传感器和目前的不一样
        if (this.kinect!=value)
        {
            //如果当前的传感对象不为null
            if (this.kinect!=null)
            {
              UninitializeKinectSensor(this.kinect);
              //uninitailize当前对象
                this.kinect=null;
            }
            //如果传入的对象不为空，且状态为连接状态
            if (value!=null&&value.Status==KinectStatus.Connected)
            {
                this.kinect=value;
                InitializeKinectSensor(this.kinect);
            }
        }
    }
}

private void InitializeKinectSensor(KinectSensor kinectSensor)
{
    if (kinectSensor != null)
    {
        kinectSensor.ColorStream.Enable();
        kinectSensor.ColorFrameReady += new EventHandler<ColorImageFrameReadyEventArgs>(kinectSensor_ColorFrameReady);
        kinectSensor.Start();
    }
}

private void UninitializeKinectSensor(KinectSensor kinectSensor)
{
    if (kinectSensor != null)
    {
        kinectSensor.Stop();
        kinectSensor.ColorFrameReady -= new EventHandler<ColorImageFrameReadyEventArgs>(kinectSensor_ColorFrameReady);
    }
}

上面的代码对之前Kinect属性进行了修改，加粗为修改部分。新添加的两行调用了两个方法，分别初始化和释放KinectSensor和 ColorImageStream对象。InitializeKinectSensor对象调用ColorImageStream的Enable方法，注册ColorFrameReady事件并调用start方法。一旦打开了传感器，当新数据帧大道是就会触发frameready事件，该事件触发频率是每秒30次。

在实现Kinect_ColorFrameReady方法前，我们先在XAML窗体中添加一些空间来展现获取到的数据，代码如下:

<Window x:Class="KinectApplicationFoundation.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="ColorImageStreamFromKinect" Height="350" Width="525">
    <Grid>
        <Image x:Name="ColorImageElement"></Image>
    </Grid>
</Window>

然后，在Kinect_ColorFrameReady方法中，我们首先通过打开或者获取一个frame来提取获Frame数据。 ColorImageFrameReadyEventArgs对象的OpenColorImageFrame属性返回一个当前的 ColorImageFrame对象。这个对象实现了IDisposable接口。所以可以将这个对象抱在using语句中的原因,在提取像素数据之前需要使用一个Byte数组保存获取到的数据。FrameObject对象的PixelDataLength对象返回数据和序列的具体大小。调用 CopyPixelDataTo方法可以填充像素数据，然后将数据展示到image控件上，具体代码如下：

void kinectSensor_ColorFrameReady(object sender, ColorImageFrameReadyEventArgs e)
{
    using (ColorImageFrame frame = e.OpenColorImageFrame())
    {
        if (frame != null)
        {
            byte[] pixelData = new byte[frame.PixelDataLength];
            frame.CopyPixelDataTo(pixelData);
            ColorImageElement.Source = BitmapImage.Create(frame.Width, frame.Height, 96, 96,
                                                         PixelFormats.Bgr32, null, pixelData,
                                                         frame.Width * frame.BytesPerPixel);

        }
    }
}

运行程序，就能得到从Kinect获取的视频信息，如下图所示这是从Kinect彩色摄像头获取的我房间的照片。和一般的视频没什麽两样，只不过这个是从Kinect的视频摄像头产生的。

3. 结语

本文简要介绍了Kinect开发会遇到的基本对象，Kinect物理设备的发现，KinectSensor对象的初始化，打开KinectSensor对象以及如何获取数据流，最后以ColorImageStream对象为例展示了如何从Kinect获取数据并展现出来。

由于Kinect的彩色摄像头默认每秒产生30副ColorImageFrame，所以上面的应用程序会产生30个Bitmap对象，而且这些对象初始化后很快将变成垃圾等待垃圾回收器进行收集，当采集的数据量很大时，将会对性能产生影响。限于篇幅原因，下篇文章将会介绍如何对这一点进行改进，并将讨论获取Kinect传感器产生数据的两种编程模式：基于事件的模式和轮询的模式。本文示例代码点击此处下载，希望以上内容希望对你了解Kinect SDK有所帮助。

作者： yangecnu（yangecnu’s Blog on 博客园）
出处：http://www.cnblogs.com/yangecnu/
本作品由yangecnu 创作，采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。欢迎转载，但任何转载必须保留完整文章，在显要地方显示署名以及原文链接。如您有任何疑问或者授权方面的协商，请给我留言。

[转载]Kinect手势数据集 - Kinect for Windows 开发技术教程-Kinect体感游戏网 - xbox360 kinect体感游戏论坛 - xbox360 kinect体感游戏开发 - cnKinect.com

2015-12-09mikel阅读(1612)

来源： [转载]Kinect手势数据集 – Kinect for Windows 开发技术教程-Kinect体感游戏网 – xbox360 kinect体感游戏论坛 – xbox360 kinect体感游戏开发 – cnKinect.com

微软研究院代号剑桥-12 的Kinect 手势数据集包含了一系列的代表肢体定位的人类动作和被系统确认的关联手势。

这个数据集收集了30个人执行的12个手势总共包含594 个序列和719,359个帧数——大约六个小时零四十分钟的时间。总共有6244个手势实例。那些动画文件被使用Kinect的动作预计管道来串联起来。

玩家的身体姿势被以精确度为里关节位置两厘米的精度，采样速率为30Hz的速度被捕捉下来。

下载详情：

文件名称:	MicrosoftGestureDataset.zip
版本:	1
发布日期:	24 April 2012
文件大小:	165.17 MB

原文链接：http://research.microsoft.com/en-us/downloads/4e1c9174-9b94-4c4d-bc5e-0a9c929869a7/default.aspx

[转载]使用Kinect 进行图片浏览 - yangecnu - 博客园

2015-12-09mikel阅读(993)

来源： [转载]使用Kinect 进行图片浏览 – yangecnu – 博客园

相信大家都有过在多媒体触摸设备如手机，平板电脑上进行照片浏览，放大、缩小、旋转等操作的经历。前面有篇文章也介绍了如何搭建开发这类程序的模拟环境。在了解了Kinect SDK 后我们就可以使用无接触的方式隔空的来进行这类操作了。这是不是有点像Minority Report里面的感觉。

下面我们就来实现一个简单的使用Kinect来进行图片浏览的小程序。

一、总体思路

首先运用WPF编写一个简单的支持多点触控的图片浏览程序，这方面您可以参看MSDN上的这篇文章，上面有代码，可能需要FQ才能下载。中文的话，您可以参考Gnie同学关于在WPF上面多点触屏(MultiTouch)应用程序的相关文章，这些是基础。

然后，将从Kinect骨骼信息中提取到的双手的位置信息，模拟为触摸屏上的点击，这个有点麻烦，也是本文的重点。这方面我参考了candescentnui这一开源项目。

下面就来简单介绍下如何实现。

二、具体步骤

（1）完成多点触摸类逻辑的编写

WPF本身支持触摸屏设备和多点触控，在System.Windows.Input 下有一个TouchDevice 类，它表示触摸屏上一个手指的产生的单个触摸输入。我们需要继承这个类，并对其定制将Kienct骨骼点数据转换为触摸屏上的单个输入。为此新建一个名为 KinectTouchDevice

的类并继承 TouchDevice类和Idisposable接口。

internal class KinectTouchDevice : TouchDevice, IDisposable
{
    private DateTime? firstTouch;
    public Point Position { get; private set; }
    internal TouchState TouchState { get; private set; }


    public KinectTouchDevice(int id, PresentationSource source): base(id)
    {
        this.Position = new Point();
        this.TouchState = TouchState.Up;
        this.SetActiveSource(source);
    }

    public void Touch(Point position)
    {
        //记录第一次触摸时间
        if (!this.firstTouch.HasValue)
        {
            this.firstTouch = DateTime.Now;
            return;
        }//如果不是第一次点击，但两次间隔小于100毫秒，则认为是一次点击，不做处理
        else if (DateTime.Now.Subtract(this.firstTouch.Value).TotalMilliseconds < 100)
        {
            return;
        }
        this.Position = position;
        if (!this.IsActive)
        {
            this.Activate();
        }
        if (this.TouchState != TouchState.Down)
        {
            this.Dispatcher.Invoke(new Func<bool>(this.ReportDown));
            this.TouchState = TouchState.Down;
        }
        else
        {
            this.Dispatcher.Invoke(new Func<bool>(this.ReportMove));
        }
    }

    public void NoTouch()
    {
        this.firstTouch = null;
        if (TouchState == TouchState.Down)
        {
            this.Dispatcher.Invoke(new Func<bool>(this.ReportUp));
        }
        this.TouchState = TouchState.Up;
    }

    public override TouchPointCollection GetIntermediateTouchPoints(IInputElement relativeTo)
    {
        return new TouchPointCollection();
    }

    public override TouchPoint GetTouchPoint(IInputElement relativeTo)
    {
        var point = this.Position;
        if (relativeTo != null)
        {
            //获取当前点击位置
            point = this.ActiveSource.RootVisual.TransformToDescendant((Visual)relativeTo).Transform(point);
        }
        return new TouchPoint(this, point, new Rect(point, new Size(1, 1)), TouchAction.Move);
    }

    public void Dispose()
    {
        if (this.IsActive)
        {
            this.Deactivate();
        }
    }
}

这是一个点，如何模拟一个面板呢，所以需要建立包含这一个点的集合的新类，名为KinectTouchDevice，详细代码如下

public class KinectMultiTouchDevice : IDisposable
{
    //触控数据源
    private HandDataSource handDataSource;
    private PresentationSource presentationSource;
    //触控点集合，每一个点对应一个id
    private IDictionary<int, KinectTouchDevice> touchDevices;
    public Size TargetSize { get; set; }

    public KinectMultiTouchDevice(HandDataSource handDataSource, PresentationSource presentationSource, Size targetSize)
    {
        this.presentationSource = presentationSource;
        this.TargetSize = targetSize;
    }

    public KinectMultiTouchDevice(HandDataSource handDataSource, FrameworkElement area)
    {
        this.touchDevices = new Dictionary<int, KinectTouchDevice>();
        this.TargetSize = new Size(area.ActualWidth, area.ActualHeight);
        this.presentationSource = PresentationSource.FromVisual(area);
        this.handDataSource = handDataSource;
        //当数据源有新数据时，触发处理事件
        this.handDataSource.NewDataAvailable += handDataSource_NewDataAvailable;
        area.SizeChanged += area_SizeChanged;
    }

    private void handDataSource_NewDataAvailable(Object sender, HandCollectionEventArgs data)
    {
        if (data.IsEmpty)
        {
            ReportNoTouch(this.touchDevices.Values);
            return;
        }

        var touchedDevices = this.ReportTouches(data);
        this.ReportNoTouch(this.touchDevices.Values.Except(touchedDevices));
    }

    private void area_SizeChanged(object sender, SizeChangedEventArgs e)
    {
        this.TargetSize = e.NewSize;
    }


    private IList<KinectTouchDevice> ReportTouches(HandCollectionEventArgs data)
    {
        var touchedDevices = new List<KinectTouchDevice>();
        foreach (var hand in data.Hands)
        {
                var device = this.GetDevice(hand.Id);
                var pointOnPresentationArea = this.MapToPresentationArea(hand, new Size(this.handDataSource.Width, this.handDataSource.Height));
                device.Touch(pointOnPresentationArea);
                touchedDevices.Add(device);
        }
        return touchedDevices;
    }

    private void ReportNoTouch(IEnumerable<KinectTouchDevice> devices)
    {
        foreach (var device in devices)
        {
            device.NoTouch();
        }
    }

    private KinectTouchDevice GetDevice(int index)
    {
        if (!this.touchDevices.ContainsKey(index))
        {
            this.presentationSource.Dispatcher.Invoke(new Action(() =>
            {
                if (!this.touchDevices.ContainsKey(index))
                this.touchDevices.Add(index, new KinectTouchDevice(index, this.presentationSource));
            }));
        }
        return this.touchDevices[index];
    }

    private Point MapToPresentationArea(HandData fingerPoint, Size originalSize)
    {
        // return new Point(fingerPoint.X / originalSize.Width * this.TargetSize.Width, fingerPoint.Y / originalSize.Height * this.TargetSize.Height);
        return new Point(fingerPoint.X, fingerPoint.Y);
    }

    public void Dispose()
    {
        this.handDataSource.NewDataAvailable -= handDataSource_NewDataAvailable;
        foreach (var device in this.touchDevices.Values)
        {
            device.Dispose();
        }
    }
}

需要注意的是,上面代码中，touchDevices 是一个IDictionary<int, KinectTouchDevice> 型的对象,表示所有触控点的集合，每一个触控点有一个int型的id。代码中HandDataSource 类型的handDataSource,表示触发触控的数据源,在KinectMultiTouchDevice类的构造函数中,我们注册了 handDataSource的NewDataAvailable事件,该事件会在每当从Kinect中获取每一帧数据,且数据符合特定条件就会触发。 HandDataSource类如下：

public class HandDataSource 
{
    public delegate void NewDataHandler<HandCollectionEventArgs>(Object sender,HandCollectionEventArgs data);

    public event NewDataHandler<HandCollectionEventArgs> NewDataAvailable;

    public int Width { get; set; }

    public int Height { get; set; }

    protected virtual void OnNewDataAvailable(HandCollectionEventArgs e)
    {
        NewDataHandler<HandCollectionEventArgs> temp = NewDataAvailable;
        if (temp != null)
        {
            temp(this, e);
        }
    }

    public void RaiseNewDataEvent(List<HandData> handData) {
        HandCollectionEventArgs e = new HandCollectionEventArgs(handData);
        OnNewDataAvailable(e);
    }
}

以上部分就是使用模拟多点触控的核心代码了。

（2）界面逻辑的编写

下面我们来看应用程序的前台代码。为了在界面上显示手的位置，这里我们建立一个名为TouchControl的自定义控件，该控件很简单，里面包含一个椭圆形和一个label对象，用以表示当前手在屏幕上的位置，代码如下：

<UserControl x:Class="KinectImageView.MultiTouch.TouchControl"
             xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
             xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
             xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" 
             xmlns:d="http://schemas.microsoft.com/expression/blend/2008" 
             mc:Ignorable="d" 
             d:DesignHeight="40" d:DesignWidth="40">
    <Grid Width="40" Height="40">
        <Ellipse Stroke="White" StrokeThickness="3"/>
        <Label Foreground="White" Name="Label" HorizontalAlignment="Center" VerticalAlignment="Center"/>
    </Grid>
</UserControl>

后台逻辑代码也很简单，只有一个带参的构造函数。

public partial class TouchControl : UserControl
{
    public TouchControl()
    {
        InitializeComponent();
    }

    public TouchControl(int id)
        : this()
    {
        this.Label.Content = id;
    }
}

接下来就是主界面了，为了简便，主界面上随意摆放了三张图片，用于我们使用Kinect来进行缩放平移旋转等操作，在页面的最底层添加了一个TouchControl自定义控件，用来显示手所在的位置。整个界面前端代码如下：

<Window x:Class="KinectImageView.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="MainWindow" xmlns:c="clr-namespace:KinectImageView" Closing="Window_Closing" 
        Loaded="Window_Loaded" 
        mc:Ignorable="d" xmlns:d="http://schemas.microsoft.com/expression/blend/2008" 
        xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" 
        SizeToContent="WidthAndHeight">
    <Grid x:Name="LayoutRoot"  Height="750" Width="1000" >
        <Canvas Name="mainCanvas">
            <Image Name="image" Panel.ZIndex="642" IsManipulationEnabled="True" Width="200" Source="Images/flower.jpg" >
                <Image.RenderTransform>
                    <MatrixTransform Matrix="1.5929750047527,0.585411309251951,-0.585411309251951,1.5929750047527,564.691807426081,79.4658072348299"/>
                </Image.RenderTransform>
            </Image>
            <Image Name="image1" Panel.ZIndex="641"  IsManipulationEnabled="True"   Width="200" Source="Images/flower2.jpg" >
                <Image.RenderTransform>
                    <MatrixTransform  Matrix="1.79780224775912,-1.1136472330559,1.1136472330559,1.79780224775912,45.6962327448951,205.029554723656" />
                </Image.RenderTransform>
            </Image>
            <Image Name="image2" Panel.ZIndex="644"  IsManipulationEnabled="True"  Width="200"   Source="Images/flower3.jpg" >
                <Image.RenderTransform>
                    <MatrixTransform Matrix="2.41806325085411,-0.0527474549128994,0.0527474549128994,2.41806325085411,280.737615796121,292.420001677231"/>
                </Image.RenderTransform>
            </Image>         
        </Canvas>
        <Canvas Name="fingerCanvas"></Canvas>
    </Grid>
</Window>

下面来看看后台代码，WPF默认支持开发多点触控的程序，只需要从写下面三个方法即可：

protected override void OnManipulationStarting(ManipulationStartingEventArgs e)
{
    base.OnManipulationStarting(e);
    e.ManipulationContainer = mainCanvas;
    e.Handled = true;
}

protected override void OnManipulationDelta(ManipulationDeltaEventArgs e)
{
    base.OnManipulationDelta(e);
    var element = e.Source as FrameworkElement;
    var transformation = element.RenderTransform as MatrixTransform;
    //获取缩放的中心点
    Point center = new Point(element.ActualWidth / 2, element.ActualHeight / 2);
    var matrix = transformation == null ? Matrix.Identity : transformation.Matrix;
    center = matrix.Transform(center);
    //缩放
    if (e.DeltaManipulation.Scale.X > 0.5 && e.DeltaManipulation.Scale.Y > 0.5
        && e.DeltaManipulation.Scale.X < 2 && e.DeltaManipulation.Scale.Y < 2)
        matrix.ScaleAt(e.DeltaManipulation.Scale.X, e.DeltaManipulation.Scale.Y, center.X, center.Y);
    //旋转
    matrix.RotateAt(e.DeltaManipulation.Rotation, center.X, center.Y);
    //移动
    if (center.X > 0 && center.Y > 0
        && center.X < this.mainCanvas.ActualWidth
        && center.Y < this.mainCanvas.ActualHeight)
        matrix.Translate(e.DeltaManipulation.Translation.X, e.DeltaManipulation.Translation.Y);

    element.RenderTransform = new MatrixTransform(matrix);
}

protected override void OnManipulationInertiaStarting(ManipulationInertiaStartingEventArgs e)
{
    base.OnManipulationInertiaStarting(e);
    e.TranslationBehavior.DesiredDeceleration = 0.001;
    e.RotationBehavior.DesiredDeceleration = 0.01;
    e.ExpansionBehavior.DesiredDeceleration = 0.01;
}

除此之外，为了使用Kinect数据模拟触控，我们还需要重载OnTouchMove，OnTouchDown和OnTouchUp这三个方法，详细代码如下：

protected override void OnTouchMove(TouchEventArgs e)
{
    base.OnTouchMove(e);
    HandleTouch(e);
}

protected override void OnTouchDown(TouchEventArgs e)
{
    base.OnTouchDown(e);
    HandleTouch(e);
}

protected override void OnTouchUp(TouchEventArgs e)
{
    base.OnTouchUp(e);
    this.fingerCanvas.Children.Remove(this.touchPoints[e.TouchDevice.Id]);
    this.touchPoints.Remove(e.TouchDevice.Id);
}

private void HandleTouch(TouchEventArgs e)
{
    var visual = GetTouchVisual(e.TouchDevice.Id);
    var point = e.GetTouchPoint(this.fingerCanvas).Position;
    visual.SetValue(Canvas.LeftProperty, point.X);
    visual.SetValue(Canvas.TopProperty, point.Y);
}

private TouchControl GetTouchVisual(int deviceId)
{
    if (this.touchPoints.ContainsKey(deviceId))
    {
        return this.touchPoints[deviceId];
    }

    var touchControl = new TouchControl(deviceId);
    this.touchPoints.Add(deviceId, touchControl);
    this.fingerCanvas.Children.Add(touchControl);
    return touchControl;
}

以上工作做好之后，我们现在需要从Kinect中获取数据，然后发起事件，传递参数，根据数据来模拟屏幕点击。如何建立Kinect连接，以及如何获取数据这里不详细讲解了，你可以参考之前Kinect for Windows SDK入门系列文章。这里就如何从Kinect获取数据以及如何发起事件来进行详细讨论。从Kinect中获取数据最简单的方法就是注册相应事件，在本例中，我们需要骨骼数据，所以需要注册KinectSensor对象的SkeletonFrameReady事件。具体的事件中处理代码如下：

private void KinectDevice_SkeletonFrameReady(object sender, SkeletonFrameReadyEventArgs e)
{
    using (SkeletonFrame frame = e.OpenSkeletonFrame())
    {
        if (frame != null)
        {
            frame.CopySkeletonDataTo(this.frameSkeletons);
            Skeleton skeleton = GetPrimarySkeleton(this.frameSkeletons);

            if (skeleton != null)
            {
                Joint head = skeleton.Joints[JointType.Head];

                Joint leftHand = skeleton.Joints[JointType.HandLeft];
                Joint leftWrist = skeleton.Joints[JointType.WristLeft];

                Joint rightHand = skeleton.Joints[JointType.HandRight];
                Joint rightWrist = skeleton.Joints[JointType.WristRight];

                Point leftHandPos = GetPosition(leftHand);
                Point leftWristPos = GetPosition(leftWrist);

                Point rightHandPos = GetPosition(rightHand);
                Point rightWristPos = GetPosition(rightWrist);


                if (rightHandPos.Y < rightWristPos.Y && leftHandPos.Y < leftWristPos.Y)
                {
                    leftHandTarget = GetHitTarget(skeleton.Joints[JointType.HandLeft], mainCanvas);
                    rightHandTarget = GetHitTarget(skeleton.Joints[JointType.HandRight], mainCanvas);

                    if (rightHandTarget != null)
                    {
                        dics.Clear();
                        foreach (Image element in mainCanvas.Children)
                        {
                            dics.Add(element, Canvas.GetZIndex(element));
                        }
                        ResetZIndex(dics, rightHandTarget);
                    }
                    if (leftHandTarget != null && rightHandTarget != null)
                    {
                        Image leftHandHitImage = leftHandTarget as System.Windows.Controls.Image;
                        Image rightHnadHitImage = rightHandTarget as System.Windows.Controls.Image;
                        if (leftHandHitImage != null && rightHnadHitImage != null)
                        {

                            String leftHandName = leftHandHitImage.Name;
                            String rightHandName = leftHandHitImage.Name;
                            if (rightHandName.Equals(leftHandName))
                            {
                                List<HandData> list = new List<HandData>()
                        {
                            new HandData{ Id=1,X=leftHandPos.X,Y=leftHandPos.Y},
                            new HandData{ Id=2,X=rightHandPos.X,Y=rightHandPos.Y}
                        };
                                handDataSource.RaiseNewDataEvent(list);
                            }
                        }
                    }
                    else
                    {
                        handDataSource.RaiseNewDataEvent(new List<HandData>());
                    }
                }
                else
                {
                    handDataSource.RaiseNewDataEvent(new List<HandData>());
                }
            }
        }
    }
}

在该方法中，我们从骨骼数据中获取左右手的具体位置，然后当左右手的手部(hand)高于肘部(wrist)时,则认为用户是要进行操作；然后根据左右手所在的位置，获取当前左右手所在的对象，将该对象置于最前，以便于我们进行操作。然后判断左右手是否位于同一个对象之上，如果是，则将左右手的坐标点存储到list中，触发事件handDataSource.RaiseNewDataEvent(list)，提醒有新的触摸点产生。这里 handDataSource对象是在Window_Loaded方法中初始化的。

private void Window_Loaded(object sender, RoutedEventArgs e)
{
    handDataSource = new HandDataSource();
    handDataSource.Width = kinectDevice.DepthStream.FrameWidth;
    handDataSource.Height = kinectDevice.DepthStream.FrameHeight;
    this.device = new KinectMultiTouchDevice(handDataSource, this);
    this.touchPoints = new Dictionary<int, TouchControl>();
}

从上面的方法中可以看到，我们初始化KinectMultiTouchDevice类型的device对象的时候传入了handDataSource，所以在上面我们触发handDataSource的RaiseNewDataEvent事件时，device的构造函数中注册了该事件，所以会模拟触控点击。

运行程序后，效果如下：

三结语

以上是一个简单的利用Kinect来进行图片浏览的例子，这里面重点在于如何使用Kinect数据来模拟触控，以及WPF中的多点触控编程。当然，上面的例子中还有很多值得改进的地方，如对原始获取的骨骼数据可以进行一些过滤，平滑，插值处理；对于图片的缩放范围可以进行进一步的控制，以防止图片过大或过小，导致后面手部不能够位于图片上；图片和图片之间切换不够流畅。以上存在的问题，如果您感兴趣的话，可以试着进行一些改进。

本文源代码点击此处下载，希望本文对您了解Kinect开发有所帮助。

[转载]Kinect控制PowerPoint播放 - yangecnu - 博客园

2015-12-09mikel阅读(1353)

来源： [转载]Kinect控制PowerPoint播放 – yangecnu – 博客园

有了Kinect，我们就可以使用手势来控制幻灯片的播放，而不需要一边演讲一遍按键盘或者手持一个ppt控制器，我们只需要做的就是轻轻的向右或者向左挥一下手就可以控制幻灯片向前或者向后翻一页，酷吧。虽然可能在演讲的时候做这个动作可能有点奇怪，但是这也是一种控制幻灯片放映的好方法。

实现Kinect控制幻灯片播放很简单，主要思路是：使用Kinect捕捉人体动作，然后根据识别出来的动作向系统发出点击向前，向后按键的事件，从而使得幻灯片能够切换。这里的核心功能在于手势的识别，我们在开发之前需要定义怎么样的手势算是向前或者向后切换幻灯片。手势和姿势识别在我的Kinect开发入门第九，第十，十一篇文章有详细介绍。本文仅讨论主要思路及关键代码部分。

一通过姿势识别实现ppt控制

姿势(pose)识别是通过关节点与关节点之间的相对位置关系来进行判断，相对来说比较容易，只需要通过某一帧骨骼关节点数据即可进行判断。而手势(gesture)识别则是通过对连续的一段时间内的动作来进行判断，比较复杂。但是两者对于我们需要实现特定的目的来说并没有优劣之分，就像常用的算法那样，并不是越复杂越好，有些方法就非常简单高效。

在控制ppt播放命令中，我们设定，如果右手关节点在x轴上的距离比头部关节点大于0.45的话，认为用户试图进行点击键盘上的right按钮。如果头部关节点位置在x轴方向是比左手关节点在x轴上的位置大于0.45的话，认为用户试图点击键盘上的left按钮。0.45这个值是通过反复试验的出来的，这种通过试验的方法在Kinect开发中比较常见。关键代码如下：

private void ProcessForwardBackGesture(Joint head, Joint rightHand, Joint leftHand)
{
    if (rightHand.Position.X > head.Position.X + 0.45)
    {
        if (!isBackGestureActive && !isForwardGestureActive)
        {
            isForwardGestureActive = true;
            System.Windows.Forms.SendKeys.SendWait("{Right}");
        }
    }
    else
    {
        isForwardGestureActive = false;
    }

    if (leftHand.Position.X < head.Position.X - 0.45)
    {
        if (!isBackGestureActive && !isForwardGestureActive)
        {
            isBackGestureActive = true;
            System.Windows.Forms.SendKeys.SendWait("{Left}");
        }
    }
    else
    {
        isBackGestureActive = false;
    }
}

上面的代码中，当判断到用户向右挥手动作是，执行System.Windows.Forms.SendKeys.SendWait(“{Right}”) 语句从而发出点击键盘向右按键; 该方法执行时，要求PowerPoint程序处于当前活动的状态，这样里面的PPT才会向右键盘点击事件。需要注意的是方法中 isBackGestureActive和isForwardGestureActive这两个布尔型的标志位，可以防止当用户一直处于某一个动作时会一直发送System.Windows.Forms.SendKeys.SendWait(“{xx}”)。

上面的方法可以放在sensor_SkeletonFrameReady事件中，首先获取头部，左手右手关节点数据，然后调用该方法。

void sensor_SkeletonFrameReady(object sender, SkeletonFrameReadyEventArgs e)
{
    using (var skeletonFrame = e.OpenSkeletonFrame())
    {
        if (skeletonFrame == null)
            return;

        if (skeletons == null ||
            skeletons.Length != skeletonFrame.SkeletonArrayLength)
        {
            skeletons = new Skeleton[skeletonFrame.SkeletonArrayLength];
        }

        skeletonFrame.CopySkeletonDataTo(skeletons);

        Skeleton closestSkeleton = (from s in skeletons
                                    where s.TrackingState == SkeletonTrackingState.Tracked &&
                                          s.Joints[JointType.Head].TrackingState == JointTrackingState.Tracked
                                    select s).OrderBy(s => s.Joints[JointType.Head].Position.Z)
                                            .FirstOrDefault();

        if (closestSkeleton == null)
            return;

        var head = closestSkeleton.Joints[JointType.Head];
        var rightHand = closestSkeleton.Joints[JointType.HandRight];
        var leftHand = closestSkeleton.Joints[JointType.HandLeft];

        if (head.TrackingState != JointTrackingState.Tracked ||
            rightHand.TrackingState != JointTrackingState.Tracked ||
            leftHand.TrackingState != JointTrackingState.Tracked)
        {
            //Don't have a good read on the joints so we cannot process gestures
            return;
        }

       ProcessForwardBackGesture(head, rightHand, leftHand);
    }
}

通过姿势识别来进行幻灯片控制简单高效，但是也存在着两个主要问题:

首先是，如果幻灯片中嵌套有视频，flash或者其他多媒体要素的话，可能不能很好的控制这些要素的播放和暂停，一种处理办法是使用动画，使得用户在点击键盘显示多媒体的时候就开始播放。还有一种方法是使用VSTO编写针对PowerPoint的插件，来监听鼠标来控制多媒体播放。

其次是误操作问题，这个问题是使用基于姿势识别存在的最大问题。有时候可能出于肢体语言表达需要，可能需要张开双臂，或者弯下腰来捡东西，这样会使得头部关节点位置和手部关节点位置的相对关系可能会满足之前我们设定的距离，从而产生误操作。

使用姿势识别的第一个问题是一个普遍存在的问题，即使使用ppt控制器也存在该问题，ppt控制器似乎也是通过发送键盘点击事件来进行幻灯片控制的。第二个问题可以使用手势识别的方式来在一定程度上避免。

二通过手势识别实现ppt控制

手势识别通过判断在一定时间内一系列连续的动作之间的前后相关关系来进行动作的识别，在第十篇文章中对swip这一动作如何识别有详细介绍。在Kinect for Windows Developer ToolKit v 1.5中，增加了一个名为Slideshow Gesture-WPF的例子。

我们可以直接打开其源代码，可惜的是，其中的挥动手势识别代码被封装在了一个名为Microsoft.Samples.Kinect.SwipeGestureRecognizer的dll中，

使用Reflector可以查看其实现方式，大体的原理和我之前第十篇文章中相似，不过其提供了基于手势库的识别方式，以后我会详细介绍，在这里我们可以直接使用该dll提供的方法。

要使用该dll提供的手势识别，必须先创建一个Recognizer对象。然后初始化改Recognizer。在初始化的时候注册左右挥动识别后进行的操作，该操作可以通过方法提供，由于方法体比较小，这里使用lambda表达式。

private readonly Recognizer activeRecognizer;
this.activeRecognizer = this.CreateRecognizer();
private Recognizer CreateRecognizer()
{
    // Instantiate a recognizer.
    var recognizer = new Recognizer();
    // swipe right to  press right key .
    recognizer.SwipeRightDetected += (s, e) =>
    {
            System.Windows.Forms.SendKeys.SendWait("{Right}");
    };
    // swipe left to  press left key ..
    recognizer.SwipeLeftDetected += (s, e) =>
    {
            System.Windows.Forms.SendKeys.SendWait("{Left}");
    };
    return recognizer;
}

然后在sensor_SkeletonFrameReady事件中调用即可

private Skeleton[] skeletons = new Skeleton[0];
private void sensor_SkeletonFrameReady(object sender, SkeletonFrameReadyEventArgs e)
{
    // Get the frame.
    using (var frame = e.OpenSkeletonFrame())
    {
        // Ensure we have a frame.
        if (frame != null)
        {
            // Resize the skeletons array if a new size (normally only on first call).
            if (this.skeletons.Length != frame.SkeletonArrayLength)
            {
                this.skeletons = new Skeleton[frame.SkeletonArrayLength];
            }
            // Get the skeletons.
            frame.CopySkeletonDataTo(this.skeletons);
            // Pass skeletons to recognizer.
            this.activeRecognizer.Recognize(sender, frame, this.skeletons);
        }
    }
}

把上面的代码放到程序中，运行即可看到使用左手向左挥手，使用右手向右挥手即可控制幻灯片向左向右切换。如前面的文章所述，使用手势识别动作有一个时间阈值和一定的规则，如果该动作在某一时间内没有完成则识别失败。所以在本例中，如果挥手动作过慢，可能导致识别不出。而不像之前使用姿势识别例子中的那样，只需保持某个动作即可完成识别操作，这在一定程度上减少了第一种情况下出现误识别的概率。

运行效果如下：

三总结

本文介绍了使用Kinect实现控制ppt播放的两种方法，一种是基于姿势识别一种是基于手势识别，并介绍了这两种方法的优缺点以及实现的部分代码。其实利用Kinect完全可以实现常用ppt控制器上的功能，比如说LED指示灯，使用Kinect也可以实现该功能，就是把用户手势所在的位置映射到屏幕上，并以红色显示。当然仅当娱乐的话，您也可以使用语音来控制PPT的播放。相信您看了之前我写的一些文章在加上上面给出的代码，实现Kinect控制幻灯片播放应该很容易了。这里就不提供原代码了。希望本文对您了解Kinect中的姿势和手势识别有所帮助。

上一页
1
···
266
267
268
269
270
271
272
...
下一页
共 883 页

开发笔记 第269页

1. 获取骨骼数据

2. 骨骼对象模型

2.1 SkeletonStream对象

2.2 SkeletonFrame

2.3 Skeleton

2.4 Joint

3. 结语

1. 简单的景深影像处理

1.1深度影像数据直方图

1.2 一些图像处理相关的知识

2. 深度数据和游戏者索引位

3. 对物体进行测量

4.深度值图像和视频图像的叠加

5.结语

1. Kinect传感器

2. Kinect 深度测量原理

3. 深度影像增强

3.1增强深度影像灰度级

3.2 深度数据的彩色渲染

4. 结语

1. 性能改进

2. 简单的图像处理

3. 截图

4. ColorImageStream对象图

5. 获取数据的方式：事件模式 VS “拉”模式

6. 结语

Kinect cursor for hand tracking

Prerequisites

The code

Step 1: Download the project from GitHub

Step 2: Import the assembly to your project

Step 3: Import the assembly to your XAML code

Step 4: Move the cursor using C#

Copyrights

1. Kinect传感器

1.1 发现连接的Kinect设备

1.2 打开传感器

1.3 停止传感器

2. 彩色影像数据流

3. 结语

一、总体思路

二、具体步骤

（1）完成多点触摸类逻辑的编写

（2）界面逻辑的编写

三 结语

一 通过姿势识别实现ppt控制

二 通过手势识别实现ppt控制

三 总结

热门标签

分类

链接表

开发笔记第269页

三结语

一通过姿势识别实现ppt控制

二通过手势识别实现ppt控制

三总结