query/src/main/scala/filodb/query/exec/MultiSchemaPartitionsExec.scala

package filodb.query.exec

import kamon.Kamon
import monix.execution.Scheduler

import filodb.core.DatasetRef
import filodb.core.metadata.Schemas
import filodb.core.query.{ColumnFilter, QueryConfig, QueryContext, QuerySession, QueryWarnings}
import filodb.core.query.Filter.Equals
import filodb.core.store._
import filodb.query.Query.qLogger

final case class UnknownSchemaQueryErr(id: Int) extends
  Exception(s"Unknown schema ID $id during query.  This likely means a schema config change happened and " +
            "the partitionkeys tables were not truncated.")

/**
  * ExecPlan to select raw data from partitions that the given filter resolves to,
  * in the given shard, for the given row key range.  Schema-agnostic - discovers the schema and
  * creates an inner SelectRawPartitionsExec with the right column IDs and other details depending on schema.
  * The inner SelectRawPartitionsExec may have modified transformers based on the discovered schema -
  *   ex. some RangeFunctions are transformed for downsample gauge schemas.
  *
  * @param schema an optional schema to filter partitions using.  If not supplied, schema is discovered.
  * @param colName optional column name to select for querying.  If not supplied, the default valueColumn from
  *               data schema definition is used.  For downsampled gauges, column is automatically chosen.
  */
final case class MultiSchemaPartitionsExec(queryContext: QueryContext,
                                           dispatcher: PlanDispatcher,
                                           dataset: DatasetRef,
                                           shard: Int,
                                           filters: Seq[ColumnFilter],
                                           chunkMethod: ChunkScanMethod,
                                           metricColumn: String,
                                           schema: Option[String] = None,
                                           colName: Option[String] = None) extends LeafExecPlan {
  import SelectRawPartitionsExec._

  override def allTransformers: Seq[RangeVectorTransformer] = finalPlan.rangeVectorTransformers

  @transient // dont serialize the SelectRawPartitionsExec plan created for plan execution
  var finalPlan: SelectRawPartitionsExec = _

  // Remove _columnName suffix from metricName and generate PartLookupResult
  private def removeSuffixAndGenerateLookupResult(filters: Seq[ColumnFilter], metricName: String, columnName: String,
                                                  source: ChunkSource,
                                                  querySession: QuerySession) = {
    // Assume metric name has only equal filter
    val filterWithoutColumn = filters.filterNot(_.column == metricColumn) :+
      ColumnFilter(metricColumn, Equals(metricName.stripSuffix(s"_$columnName")))

    val partMethod = FilteredPartitionScan(ShardSplit(shard), filterWithoutColumn)
    // clear stats since previous call to lookupPartitions set the stat with metric name that has suffix
    querySession.queryStats.clear()
    val lookupRes = source.lookupPartitions(dataset, partMethod, chunkMethod, querySession)
    (lookupRes, Some(columnName))
  }

  // scalastyle:off method.length
  private def finalizePlan(source: ChunkSource,
                           querySession: QuerySession): SelectRawPartitionsExec = {
    val partMethod = FilteredPartitionScan(ShardSplit(shard), filters)
    Kamon.currentSpan().mark("filtered-partition-scan")
    var lookupRes = source.lookupPartitions(dataset, partMethod, chunkMethod, querySession)
    val metricName = filters.find(_.column == metricColumn).map(_.filter.valuesStrings.head.toString)
    var newColName = colName

    /*
     * As part of Histogram query compatibility with Prometheus format histograms, we
     * remove _sum, _count suffix from metric name here. _bucket & le are already
     * removed in SingleClusterPlanner. We remove the suffix only when partition lookup does not return any results
     */
    if (lookupRes.firstSchemaId.isEmpty && querySession.queryConfig.translatePromToFilodbHistogram &&
        colName.isEmpty && metricName.isDefined) {
      val res = if (metricName.get.endsWith("_sum"))
        removeSuffixAndGenerateLookupResult(filters, metricName.get, "sum", source, querySession)
      else if (metricName.get.endsWith("_count"))
        removeSuffixAndGenerateLookupResult(filters, metricName.get, "count", source, querySession)
      else (lookupRes, newColName)

      lookupRes = res._1
      newColName = res._2
    }

    Kamon.currentSpan().mark("lookup-partitions-done")

    queryContext.checkQueryTimeout(this.getClass.getName)

    // Find the schema if one wasn't supplied
    val schemas = source.schemas(dataset).get
    // If we cannot find a schema, or none is provided, we cannot move ahead with specific SRPE planning
    schema.map { s => schemas.schemas(s) }
          .orElse(lookupRes.firstSchemaId.map(schemas.apply))
          .map { sch =>
            // There should not be any unknown schemas at all, as they are filtered out during ingestion and
            // in bootstrapPartKeys().  This might happen after schema changes if old partkeys are not truncated.
            if (sch == Schemas.UnknownSchema) throw UnknownSchemaQueryErr(lookupRes.firstSchemaId.getOrElse(-1))

            // Get exact column IDs needed, including max column as needed for histogram calculations.
            // This code is responsible for putting exact IDs needed by any range functions.
            val colIDs1 = getColumnIDs(sch, newColName.toSeq, rangeVectorTransformers)
            val colIDs  = addIDsForHistMax(sch, colIDs1)

            // Modify transformers as needed for histogram w/ max, downsample, other schemas
            val newxformers1 = newXFormersForDownsample(sch, rangeVectorTransformers)
            val newxformers = newXFormersForHistMax(sch, colIDs, newxformers1)

            val newPlan = SelectRawPartitionsExec(queryContext, dispatcher, dataset,
                                                  Some(sch), Some(lookupRes),
                                                  schema.isDefined, colIDs, planId)
            qLogger.debug(s"Discovered schema ${sch.name} and created inner plan $newPlan")
            newxformers.foreach { xf => newPlan.addRangeVectorTransformer(xf) }
            newPlan
          }.getOrElse {
            qLogger.debug(s"No time series found for filters $filters... employing empty plan")
            SelectRawPartitionsExec(queryContext, dispatcher, dataset,
                                    None, Some(lookupRes),
                                    schema.isDefined, Nil, planId)
          }
  }
  // scalastyle:on method.length

  def doExecute(source: ChunkSource,
                querySession: QuerySession)
               (implicit sched: Scheduler): ExecResult = {
    source.checkReadyForQuery(dataset, shard, querySession)
    source.acquireSharedLock(dataset, shard, querySession)
    finalPlan = finalizePlan(source, querySession)
    finalPlan.doExecute(source, querySession)(sched)
  }

  protected def args: String = s"dataset=$dataset, shard=$shard, " +
                               s"chunkMethod=$chunkMethod, filters=$filters, colName=$colName, schema=$schema"

  // Print inner node's details for debugging
  override def curNodeText(level: Int): String = {
    val innerText = Option(finalPlan).map(e => s"Inner: + ${e.curNodeText(level + 1)}\n").getOrElse("")
    s"${super.curNodeText(level)} $innerText".trim
  }

  override protected def printRangeVectorTransformersForLevel(level: Int = 0) = {
     Option(finalPlan).getOrElse(this).rangeVectorTransformers.reverse.zipWithIndex.map { case (t, i) =>
       s"${"-" * (level + i)}T~${t.getClass.getSimpleName}(${t.args})" +
         printFunctionArgument(t, level + i + 1).mkString("\n")
    }
  }

  override def checkResultBytes(resultSize: Long, queryConfig: QueryConfig, queryWarnings: QueryWarnings): Unit = {
    super.checkResultBytes(resultSize, queryConfig, queryWarnings)
    finalPlan.lookupRes.foreach(plr =>
      if (plr.dataBytesScannedCtr.get() > queryContext.plannerParams.warnLimits.rawScannedBytes) {
        queryWarnings.updateRawScannedBytes(plr.dataBytesScannedCtr.get())
        val msg =
          s"Query scanned ${plr.dataBytesScannedCtr.get()} bytes, which exceeds a max warn limit of " +
            s"${queryContext.plannerParams.warnLimits.rawScannedBytes} bytes allowed to be scanned per shard. "
        qLogger.info(queryContext.getQueryLogLine(msg))
      }
    )
  }
}