rtphone/src/engine/media/MT_AudioReceiver.cpp

/* Copyright(C) 2007-2018 VoIPobjects (voipobjects.com)
 * This Source Code Form is subject to the terms of the Mozilla Public
 * License, v. 2.0. If a copy of the MPL was not distributed with this
 * file, You can obtain one at http://mozilla.org/MPL/2.0/. */

#define NOMINMAX

#include "../config.h"
#include "MT_AudioReceiver.h"
#include "MT_AudioCodec.h"
#include "MT_CngHelper.h"
#include "../helper/HL_Log.h"
#include "../audio/Audio_Interface.h"
#include "../audio/Audio_Resampler.h"

#if defined(USE_AMR_CODEC)
# include "MT_AmrCodec.h"
#endif

#include <algorithm>

#define LOG_SUBSYSTEM "AudioReceiver"

//#define DUMP_DECODED

using namespace MT;

// ----------------- RtpBuffer::Packet --------------
RtpBuffer::Packet::Packet(std::shared_ptr<RTPPacket> packet, int timelength, int rate)
    :mRtp(packet), mTimelength(timelength), mRate(rate)
{
}

std::shared_ptr<RTPPacket> RtpBuffer::Packet::rtp() const
{
    return mRtp;
}

int RtpBuffer::Packet::timelength() const
{
    return mTimelength;
}

int RtpBuffer::Packet::rate() const
{
    return mRate;
}

// ------------ RtpBuffer ----------------
RtpBuffer::RtpBuffer(Statistics& stat)
    :mStat(stat), mSsrc(0), mHigh(RTP_BUFFER_HIGH), mLow(RTP_BUFFER_LOW), mPrebuffer(RTP_BUFFER_PREBUFFER),
      mFirstPacketWillGo(true),
      mReturnedCounter(0), mAddCounter(0), mFetchedPacket(std::shared_ptr<RTPPacket>(), 0, 0)
{
}

RtpBuffer::~RtpBuffer()
{
    ICELogDebug(<< "Number of add packets: " << mAddCounter << ", number of retrieved packets " << mReturnedCounter);
}

void RtpBuffer::setHigh(int milliseconds)
{
    mHigh = milliseconds;
}

int RtpBuffer::high()
{
    return mHigh;
}

void RtpBuffer::setLow(int milliseconds)
{
    mLow = milliseconds;
}

int RtpBuffer::low()
{
    return mLow;
}

void RtpBuffer::setPrebuffer(int milliseconds)
{
    mPrebuffer = milliseconds;
}

int RtpBuffer::prebuffer()
{
    return mPrebuffer;
}

int RtpBuffer::getCount() const
{
    Lock l(mGuard);
    return mPacketList.size();
}

bool SequenceSort(const RtpBuffer::Packet& p1, const RtpBuffer::Packet& p2)
{
    return p1.rtp()->GetExtendedSequenceNumber() < p2.rtp()->GetExtendedSequenceNumber();
}

bool RtpBuffer::add(std::shared_ptr<jrtplib::RTPPacket> packet, int timelength, int rate)
{
    if (!packet)
        return false;

    Lock l(mGuard);

    // Update statistics
    mStat.mSsrc = packet->GetSSRC();

    // Update jitter
    ICELogMedia(<< "Adding new packet into jitter buffer");
    mAddCounter++;

    // Look for maximum&minimal sequence number; check for dublicates
    unsigned maxno = 0xFFFFFFFF, minno = 0;

    // New sequence number
    unsigned newSeqno = packet->GetExtendedSequenceNumber();

    for (PacketList::iterator iter = mPacketList.begin(); iter != mPacketList.end(); iter++)
    {
        Packet& p = *iter;
        unsigned seqno = p.rtp()->GetExtendedSequenceNumber();

        if (seqno == newSeqno)
        {
            mStat.mDuplicatedRtp++;
            ICELogMedia(<< "Discovered duplicated packet, skipping");
            return false;
        }

        if (seqno > maxno)
            maxno = seqno;
        if (seqno < minno)
            minno = seqno;
    }

    int available = findTimelength();

    if (newSeqno > minno || (available < mHigh))
    {
        Packet p(packet, timelength, rate);
        mPacketList.push_back(p);
        std::sort(mPacketList.begin(), mPacketList.end(), SequenceSort);

        // Limit by max timelength
        available = findTimelength();

        while (available > mHigh && mPacketList.size())
        {
            //ICELogMedia( << "Dropping RTP packet from jitter");
            available -= mPacketList.front().timelength();
            mPacketList.erase(mPacketList.begin());
        }
    }
    else
    {
        ICELogMedia(<< "Too old packet, skipping");
        mStat.mOldRtp++;
        return false;
    }

    return true;
}

RtpBuffer::FetchResult RtpBuffer::fetch(ResultList& rl)
{
    Lock l(mGuard);

    FetchResult result = FetchResult::NoPacket;
    rl.clear();

    // See if there is enough information in buffer
    int total = findTimelength();

    if (total < mLow)
        result = FetchResult::NoPacket;
    else
    {
        if (mFetchedPacket.rtp())
        {
            if (mPacketList.empty())
            {
                result = FetchResult::NoPacket;
                mStat.mPacketLoss++;
            }
            else
            {
                // Current sequence number ?
                unsigned seqno = mPacketList.front().rtp()->GetExtendedSequenceNumber();

                // Gap between new packet and previous on
                int gap = seqno - mFetchedPacket.rtp()->GetSequenceNumber() - 1;
                gap = std::min(gap, 127);
                if (gap > 0 && mPacketList.empty())
                {
                    result = FetchResult::Gap;
                    mStat.mPacketLoss += gap;
                    mStat.mLoss[gap]++;
                }
                else
                {
                    if (gap > 0)
                    {
                        mStat.mPacketLoss += gap;
                        mStat.mLoss[gap]++;
                    }

                    result = FetchResult::RegularPacket;
                    Packet& p = mPacketList.front();
                    rl.push_back(p.rtp());

                    // Maybe it is time to replay packet right now ? For case of AMR SID packets
                    /*if (mFetchedPacket.rtp() && gap == 0 && mFetchedPacket.timelength() >= 10 && p.timelength() >= 10)
                    {
                        int timestampDelta;
                        // Timestamp difference
                        if (p.rtp()->GetTimestamp() > mFetchedPacket.rtp()->GetTimestamp())
                            timestampDelta = TimeHelper::getDelta(p.rtp()->GetTimestamp(), mFetchedPacket.rtp()->GetTimestamp());
                        else
                            timestampDelta = TimeHelper::getDelta(mFetchedPacket.rtp()->GetTimestamp(), p.rtp()->GetTimestamp());

                        // Timestamp units per packet
                        int nrOfPackets = timestampDelta / (p.timelength() * (p.rate() / 1000));

                        // Add more copies of SID (most probably) packets
                        for (int i = 0; i < nrOfPackets - 1; i++)
                        {
                            //assert(false);
                            rl.push_back(p.rtp());
                        }
                    }*/

                    // Save last returned normal packet
                    mFetchedPacket = mPacketList.front();

                    // Remove returned packet from the list
                    mPacketList.erase(mPacketList.begin());
                }
            }
        }
        else
        {
            // See if prebuffer limit is reached
            if (findTimelength() >= mPrebuffer)
            {
                // Normal packet will be returned
                result = FetchResult::RegularPacket;

                // Put it to output list
                rl.push_back(mPacketList.front().rtp());

                // Remember returned packet
                mFetchedPacket = mPacketList.front();

                // Remove returned packet from buffer list
                mPacketList.erase(mPacketList.begin());
            }
            else
            {
                ICELogMedia(<< "Jitter buffer was not prebuffered yet; resulting no packet");
                result = FetchResult::NoPacket;
            }
        }
    }

    if (result != FetchResult::NoPacket)
        mReturnedCounter++;

    return result;
}

int RtpBuffer::findTimelength()
{
    int available = 0;
    for (unsigned i = 0; i < mPacketList.size(); i++)
        available += mPacketList[i].timelength();
    return available;
}

int RtpBuffer::getNumberOfReturnedPackets() const
{
    return mReturnedCounter;
}

int RtpBuffer::getNumberOfAddPackets() const
{
    return mAddCounter;
}

//-------------- Receiver ---------------
Receiver::Receiver(Statistics& stat)
    :mStat(stat)
{
}

Receiver::~Receiver()
{
}

//-------------- AudioReceiver ----------------
AudioReceiver::AudioReceiver(const CodecList::Settings& settings, MT::Statistics &stat)
    :Receiver(stat), mBuffer(stat), mFrameCount(0), mFailedCount(0), mCodecSettings(settings),
      mCodecList(settings)
{
    // Init resamplers
    mResampler8.start(AUDIO_CHANNELS, 8000, AUDIO_SAMPLERATE);
    mResampler16.start(AUDIO_CHANNELS, 16000, AUDIO_SAMPLERATE);
    mResampler32.start(AUDIO_CHANNELS, 32000, AUDIO_SAMPLERATE);
    mResampler48.start(AUDIO_CHANNELS, 48000, AUDIO_SAMPLERATE);

    // Init codecs
    mCodecList.fillCodecMap(mCodecMap);

#if defined(DUMP_DECODED)
    mDecodedDump = std::make_shared<Audio::WavFileWriter>();
    mDecodedDump->open("decoded.wav", 8000 /*G711*/, AUDIO_CHANNELS);
#endif
}

AudioReceiver::~AudioReceiver()
{
#if defined(USE_PVQA_LIBRARY) && !defined(TARGET_SERVER)
    if (mPVQA && mPvqaBuffer)
    {
        mStat.mPvqaMos = calculatePvqaMos(AUDIO_SAMPLERATE, mStat.mPvqaReport);
    }
#endif
    mResampler8.stop();
    mResampler16.stop();
    mResampler32.stop();
    mResampler48.stop();
    mDecodedDump.reset();
}


bool AudioReceiver::add(std::shared_ptr<jrtplib::RTPPacket> p, Codec** codec)
{
    // Increase codec counter
    mStat.mCodecCount[p->GetPayloadType()]++;

    // Check if codec can be handled
    CodecMap::iterator codecIter = mCodecMap.find(p->GetPayloadType());
    if (codecIter == mCodecMap.end())
    {
        ICELogMedia(<< "Cannot find codec in available codecs");
        return false; // Reject packet with unknown payload type
    }

    // Check if codec is created actually
    if (!codecIter->second)
    {
        // Look for ptype
        for (int codecIndex = 0; codecIndex < mCodecList.count(); codecIndex++)
            if (mCodecList.codecAt(codecIndex).payloadType() == p->GetPayloadType())
                codecIter->second = mCodecList.codecAt(codecIndex).create();
    }

    // Return pointer to codec if needed
    if (codec)
        *codec = codecIter->second.get();

    if (mStat.mCodecName.empty())
        mStat.mCodecName = codecIter->second.get()->name();

    // Estimate time length
    int timelen = 0, payloadLength = p->GetPayloadLength(), ptype = p->GetPayloadType();

    if (!codecIter->second->rtpLength())
        timelen = codecIter->second->frameTime();
    else
        timelen = int(double(payloadLength) / codecIter->second->rtpLength() * codecIter->second->frameTime() + 0.5);

    // Process jitter
    mJitterStats.process(p.get(), codecIter->second->samplerate());
    mStat.mJitter = (float)mJitterStats.get().getCurrent();

    // Check if packet is CNG
    if (payloadLength >= 1 && payloadLength <= 6 && (ptype == 0 || ptype == 8))
        timelen = mLastPacketTimeLength ? mLastPacketTimeLength : 20;
    else
        // Check if packet is too short from time length side
        if (timelen < 2)
        {
            // It will cause statistics to report about bad RTP packet
            // I have to replay last packet payload here to avoid report about lost packet
            mBuffer.add(p, timelen, codecIter->second->samplerate());
            return false;
        }

    // Queue packet to buffer
    return mBuffer.add(p, timelen, codecIter->second->samplerate());
}

void AudioReceiver::processDecoded(Audio::DataWindow& output, DecodeOptions options)
{
    // Write to audio dump if requested
    if (mDecodedDump && mDecodedLength)
        mDecodedDump->write(mDecodedFrame, mDecodedLength);

    // Resample to target rate
    bool resample = !((int)options & (int)DecodeOptions::DontResample);
    makeMonoAndResample(resample ? mCodec->samplerate() : 0,
                        mCodec->channels());

    // Update PVQA with stats
#if defined(USE_PVQA_LIBRARY) && !defined(TARGET_SERVER)
    updatePvqa(mResampledFrame, mResampledLength);
#endif

    // Send to output
    output.add(mResampledFrame, mResampledLength);
}

bool AudioReceiver::getAudio(Audio::DataWindow& output, DecodeOptions options, int* rate)
{
    bool result = false;

    // Get next packet from buffer
    RtpBuffer::ResultList rl;
    RtpBuffer::FetchResult fr = mBuffer.fetch(rl);
    switch (fr)
    {
    case RtpBuffer::FetchResult::Gap:
        ICELogInfo(<< "Gap detected.");

        mDecodedLength = mResampledLength = 0;
        if (mCngPacket && mCodec)
        {
            // Synthesize comfort noise. It will be done on AUDIO_SAMPLERATE rate directly to mResampledFrame buffer.
            // Do not forget to send this noise to analysis
            mDecodedLength = mCngDecoder.produce(mCodec->samplerate(), mLastPacketTimeLength, (short*)mDecodedFrame, false);
        }
        else
            if (mCodec && mFrameCount && !mCodecSettings.mSkipDecode)
            {
                // Do PLC to mDecodedFrame/mDecodedLength
                mDecodedLength = mCodec->plc(mFrameCount, mDecodedFrame, sizeof mDecodedFrame);
            }
        if (mDecodedLength)
        {
            processDecoded(output, options);
            result = true;
        }
        break;

    case RtpBuffer::FetchResult::NoPacket:
        ICELogDebug(<< "No packet available in jitter buffer");
        mFailedCount++;
#if defined(USE_PVQA_LIBRARY) && !defined(TARGET_SERVER)
        if (mResampledLength > 0)
            updatePvqa(nullptr, mResampledLength);
#endif
        break;

    case RtpBuffer::FetchResult::RegularPacket:
        mFailedCount = 0;

        for (std::shared_ptr<RTPPacket>& p: rl)
        {
            assert(p);
            // Check if previously CNG packet was detected. Emit CNG audio here if needed.
            if ((int)options & (int)DecodeOptions::FillCngGap && mCngPacket && mCodec)
            {
                // Fill CNG audio is server mode is present
                int units = p->GetTimestamp() - mCngPacket->GetTimestamp();
                int milliseconds = units / (mCodec->samplerate() / 1000);
                if (milliseconds > mLastPacketTimeLength)
                {
                    int frames100ms = milliseconds / 100;
                    for (int frameIndex = 0; frameIndex < frames100ms; frameIndex++)
                    {
                        mDecodedLength = mCngDecoder.produce(mCodec->samplerate(), 100, (short*)mDecodedFrame, false);
                        if (mDecodedLength)
                            processDecoded(output, options);
                    }
                    // Do not forget about tail!
                    int tail = milliseconds % 100;
                    if (tail)
                    {
                        mDecodedLength = mCngDecoder.produce(mCodec->samplerate(), tail, (short*)mDecodedFrame, false);
                        if (mDecodedLength)
                            processDecoded(output, options);
                    }
                    result = true;
                }
            }

            // Find codec
            mCodec = mCodecMap[p->GetPayloadType()];
            if (mCodec)
            {
                if (rate)
                    *rate = mCodec->samplerate();

                // Check if it is CNG packet
                if ((p->GetPayloadType() == 0 || p->GetPayloadType() == 8) && p->GetPayloadLength() >= 1 && p->GetPayloadLength() <= 6)
                {
                    mCngPacket = p;
                    mCngDecoder.decode3389(p->GetPayloadData(), p->GetPayloadLength());
                    // Emit CNG mLastPacketLength milliseconds
                    mDecodedLength = mCngDecoder.produce(mCodec->samplerate(), mLastPacketTimeLength, (short*)mDecodedFrame, true);
                    if (mDecodedLength)
                        processDecoded(output, options);
                    result = true;
                }
                else
                {
                    // Reset CNG packet
                    mCngPacket.reset();

                    // Handle here regular RTP packets
                    // Check if payload length is ok
                    int tail = mCodec->rtpLength() ? p->GetPayloadLength() % mCodec->rtpLength() : 0;

                    if (!tail)
                    {
                        // Find number of frames
                        mFrameCount = mCodec->rtpLength() ? p->GetPayloadLength() / mCodec->rtpLength() : 1;
                        int frameLength = mCodec->rtpLength() ? mCodec->rtpLength() : (int)p->GetPayloadLength();

                        // Save last packet time length
                        mLastPacketTimeLength = mFrameCount * mCodec->frameTime();

                        // Decode
                        for (int i=0; i<mFrameCount && !mCodecSettings.mSkipDecode; i++)
                        {
                            // Decode frame by frame
                            mDecodedLength = mCodec->decode(p->GetPayloadData() + i*mCodec->rtpLength(),
                                                            frameLength, mDecodedFrame, sizeof mDecodedFrame);
                            if (mDecodedLength)
                                processDecoded(output, options);
                        }
                        result = mFrameCount > 0;

                        // Check for bitrate counter
#if defined(USE_AMR_CODEC)
                        processStatisticsWithAmrCodec(mCodec.get());
#endif
                    }
                    else
                        ICELogMedia(<< "RTP packet with tail.");
                }
            }
        }
        break;

    default:
        assert(0);
    }

    return result;
}

void AudioReceiver::makeMonoAndResample(int rate, int channels)
{
    // Make mono from stereo - engine works with mono only for now
    mConvertedLength = 0;
    if (channels != AUDIO_CHANNELS)
    {
        if (channels == 1)
            mConvertedLength = Audio::ChannelConverter::monoToStereo(mDecodedFrame, mDecodedLength, mConvertedFrame, mDecodedLength * 2);
        else
            mDecodedLength = Audio::ChannelConverter::stereoToMono(mDecodedFrame, mDecodedLength, mDecodedFrame, mDecodedLength / 2);
    }

    void* frames = mConvertedLength ? mConvertedFrame : mDecodedFrame;
    unsigned length = mConvertedLength ? mConvertedLength : mDecodedLength;

    Audio::Resampler* r = NULL;
    switch (rate)
    {
    case 8000:     r = &mResampler8; break;
    case 16000:    r = &mResampler16; break;
    case 32000:    r = &mResampler32; break;
    case 48000:    r = &mResampler48; break;
    default:
        memcpy(mResampledFrame, frames, length);
        mResampledLength = length;
        return;
    }

    int processedInput = 0;
    mResampledLength = r->processBuffer(frames, length, processedInput, mResampledFrame, r->getDestLength(length));
    // processedInput result value is ignored - it is always equal to length as internal sample rate is 8/16/32/48K
}

Codec* AudioReceiver::findCodec(int payloadType)
{
    MT::CodecMap::const_iterator codecIter = mCodecMap.find(payloadType);
    if (codecIter == mCodecMap.end())
        return nullptr;

    return codecIter->second.get();
}

#if defined(USE_PVQA_LIBRARY) && !defined(TARGET_SERVER)
void AudioReceiver::initPvqa()
{
    // Allocate space for 20 seconds audio
    if (!mPvqaBuffer)
    {
        mPvqaBuffer = std::make_shared<Audio::DataWindow>();
        mPvqaBuffer->setCapacity(Audio::Format().sizeFromTime(20000));
    }

    // Instantiate & open PVQA analyzer
    if (!mPVQA)
    {
        mPVQA = std::make_shared<MT::SevanaPVQA>();
        mPVQA->open(PVQA_INTERVAL, MT::SevanaPVQA::Model::Stream);
    }
}

void AudioReceiver::updatePvqa(const void *data, int size)
{
    if (!mPVQA)
        initPvqa();

    if (mPVQA)
    {
        if (data)
            mPvqaBuffer->add(data, size);
        else
            mPvqaBuffer->addZero(size);

        Audio::Format fmt;
        int frames = (int)fmt.timeFromSize(mPvqaBuffer->filled()) / (PVQA_INTERVAL * 1000);
        if (frames > 0)
        {
            int time4pvqa = (int)(frames * PVQA_INTERVAL * 1000);
            int size4pvqa = (int)fmt.sizeFromTime(time4pvqa);
            ICELogInfo(<< "Updating PVQA with " << time4pvqa << " milliseconds of audio.");
            mPVQA->update(fmt.mRate, fmt.mChannels, mPvqaBuffer->data(), size4pvqa);
            mPvqaBuffer->erase(size4pvqa);
        }
    }
}

float AudioReceiver::calculatePvqaMos(int rate, std::string& report)
{
    if (mPVQA && mPvqaBuffer)
    {
        // Flush remaining audio to analyzer
        /*if (mPvqaBuffer->filled())
    {
      mPVQA->update(rate, AUDIO_CHANNELS, mPvqaBuffer->data(), mPvqaBuffer->filled());
      mPvqaBuffer->clear();
    }*/
        return mPVQA->getResults(report, nullptr, rate, MT::SevanaPVQA::Codec::None);
    }
    return 0.0f;
}
#endif


#if defined(USE_AMR_CODEC)
void AudioReceiver::processStatisticsWithAmrCodec(Codec* c)
{
    AmrNbCodec* nb = dynamic_cast<AmrNbCodec*>(c);
    AmrWbCodec* wb = dynamic_cast<AmrWbCodec*>(c);

    if (nb != nullptr)
        mStat.mBitrateSwitchCounter = nb->getSwitchCounter();
    else
        if (wb != nullptr)
            mStat.mBitrateSwitchCounter = wb->getSwitchCounter();
}
#endif

int AudioReceiver::getSize() const
{
    int result = 0;
    result += sizeof(*this) + mResampler8.getSize() + mResampler16.getSize() + mResampler32.getSize()
            + mResampler48.getSize();

    if (mCodec)
        result += mCodec->getSize();

    return result;
}

int AudioReceiver::timelengthFor(jrtplib::RTPPacket& p)
{
    CodecMap::iterator codecIter = mCodecMap.find(p.GetPayloadType());
    if (codecIter == mCodecMap.end())
        return 0;

    PCodec codec = codecIter->second;
    if (codec)
    {
        int frameCount = p.GetPayloadLength() / codec->rtpLength();
        if (p.GetPayloadType() == 9/*G729A silence*/ && p.GetPayloadLength() % codec->rtpLength())
            frameCount++;

        return frameCount * codec->frameTime();
    }
    else
        return 0;
}

int AudioReceiver::samplerateFor(jrtplib::RTPPacket& p)
{
    CodecMap::iterator codecIter = mCodecMap.find(p.GetPayloadType());
    if (codecIter != mCodecMap.end())
    {
        PCodec codec = codecIter->second;
        if (codec)
            return codec->samplerate();
    }

    return 8000;
}

// ----------------------- DtmfReceiver -------------------
DtmfReceiver::DtmfReceiver(Statistics& stat)
    :Receiver(stat)
{
}

DtmfReceiver::~DtmfReceiver()
{
}

void DtmfReceiver::add(std::shared_ptr<RTPPacket> p)
{
}